Meta官宣深入AI大戰 推出先進大型語言模型


當地時間周五(2月25日),Facebook母公司Meta首席執行官紮克伯格最新推出“Meta人工智能大型語言模型”(LargeLanguageModelMetaAI),簡稱“LLaMA”。


紮克伯格在社交媒體上稱,Facebook AI Research研發的LLaMA是“目前水平最高的”大型語言模型,目標是幫助研究人員推進他們在人工智能(AI)領域的工作。

“大型語言模型”(LLM)可以消化大量的文本數據,並推斷文本的單詞之間的關系。隨著計算能力的進步,以及輸入數據集與參數空間的不斷擴大,LLM的能力也相應提高。

目前,LLM已經被證明能高效地執行多種任務,包括文本生成、問題回答、書面材料總結等。紮克伯格稱,LLM在自動證明數學定理、預測蛋白質結構等更復雜的方面也有很大的發展前景。

值得一提的是,近期大火的ChatGPT就是采用LLM構建的聊天機器人。ChatGPT由GPT3.5提供支持,而GPT3.5是一款基於OpenAI 175B參數基礎模型訓練的LLM,175B是它從訓練數據中所學習、沉淀下來的內容。

Meta在官網介紹中稱,LLaMA有7B、13B、33B和65B四個基礎模型,在大多數基準測試中都優於GPT3.5的前身GPT3-175B,而LLaMA-65B可與業內最佳的Chinchilla-70B和PaLM-540B競爭。


Meta還宣佈,將針對學術研究者共享其模型,正在接受研究人員的申請。與之截然不同的是,Google旗下的DeepMind和OpenAI並不公開訓練代碼。

根據2021年媒體的一份調查顯示,AI專傢們通常將DeepMind、OpenAI和FAIR(Facebook AI Research)視為該領域的“前三甲”。

去年年底,Meta發佈另一款名為Galactica的模型,但因經常分享偏見和不準確的信息而遭到下架。


相關推薦

2023-02-07

面對氣勢洶洶的OpenAIChatGPT,Google真的急!Google母公司AlphabetCEO皮查伊今日凌晨發文,正式揭曉其AI旅程的“NextStep”———Bard,一款與ChatGPT相似的對話式AI服務。值得註意的是,受限於數據集,ChatGPT無法回答2021年後的信息。而Go

2023-02-08

在矽谷這場愈演愈烈的AI大戰中,Meta哪兒去?近期,作為深度學習三巨頭之一、圖靈獎得主的Meta首席AI科學傢——YannLeCun,在CollectiveForecast組織的在線討論中說表示,就底層技術而言,ChatGPT並不是多麼不得的創新:雖然在公眾眼

2023-02-25

大語言模型的火熱中,Meta一直保持沉默。今天,Meta終於官宣自傢的大語言模型,並且會向AI研究人員開源。今天,Meta終於向全世界證明:自己是有正經研究AI的!眼看微軟、Google、OpenAI這一陣子掙足眼球,Meta也坐不住。2月24日

2023-02-25

科技巨頭爭相殺入這一領域展開混戰。周五,Meta也宣佈推出大型語言模型LLaMA,加入到由微軟、谷歌等科技巨頭主導的AI“軍備競賽”中。當地時間2月24日,Meta宣佈將推出針對研究社區的“Meta人工智能大型語言模型”系統(Large

2023-02-08

客馬拉松(hackathon)的精神”,對Bard進行測試。就在Bard官宣數分鐘後,微軟宣佈於周二舉行新聞發佈會,OpenAI首席執行官山姆·奧特曼(Sam Altman)將出席,或宣佈一項使用ChatGPT來回答的搜索查詢服務。艾夫斯分析稱:“微軟正

2024-05-11

發佈的消息被“掩埋”在一堆AI新聞裡,Google已經在本周官宣最新的中端Pixel 8a手機,並將在I/O大會揭幕當天正式開售。(來源:Google商店)鑒於Google通常都不太在意對新設備的保密,所以到現在這個點還沒有消息,足以顯示公

2024-04-19

用的價格也已經曝光,不妨按需使用。有趣的是,在 Meta 官宣 Llama 3 前,有眼尖的網友發現微軟的 Azure 市場偷跑 Llama 3 8B Instruct 版本,但隨著消息的進一步擴散,當蜂擁而至的網友再次嘗試訪問該鏈接時,得到的隻有“404”的

2023-08-10

客戶提供Meta發佈的Llama2的早期訪問權。自去年年底OpenAI推出ChatGPT 以來,消費者和企業都對這種全新的技術產生濃厚的興趣,企業也越來越希望將人工智能引入其工作流程之中,以提高效率並帶來先進的功能。IBM表示,Meta的開

2023-02-28

集團的最新成果。ChatGPT的爆火再次引發科技行業的一場AI大戰。微軟公司投資支持的OpenAI發佈ChatGPT,能夠對話和撰稿。在ChatGPT的刺激之下,Alphabet、百度等科技公司宣佈,將推出自有的類似人工智能對話機器人。上周,Meta宣佈

2023-01-22

初創企業而不是科技巨頭,是因為“谷歌和Meta都會因為推出某種編造東西的系統而蒙受巨大損失”。去年11月,Meta為科學傢發佈名為Galactica的語言模型,但僅僅三天後,由於遭到強烈反對,該模型被叫停。盡管如此,微軟對OpenA

2024-03-27

乎是紮克伯格試圖將公司打造成人工智能領域主導者的宏大戰略的一部分。而紮克伯格“搶人”的舉措,近來似乎也收獲一些成效。上周,DeepMind的前研究員Michael Valko宣佈加入Meta,將擔任Meta生成式人工智能團隊LlamaD首席工程師

2023-03-07

Facebook和Meta擁有一支龐大的AI研發團隊,上個月公司剛剛推出LLaMA。按照Meta的說法,LLaMA和OpenAI、Alphabet系統一樣擁有類似人類的超強對話能力,但需要的計算力更少。OpenAI等競爭對手保留技術,開發者如果想使用需要交費,Meta

2023-03-22

U的早期訪問客戶。為加速生成式AI開發及部署,老黃宣佈推出3款全新推理GPU,分別擅長AI視頻、圖像生成、ChatGPT等大型語言模型的推理加速。此外,英偉達還發佈AI超級計算服務DGX Cloud、加速企業創建大模型和生成式AI的雲服務N

2023-03-09

一款風靡全球的智能機器人硬件。值得一提的是,作為AI大戰的老對手,微軟也已經在“圖像+語言模型”的路數上有所佈局。在今年2月底發表的研究中,微軟就展現如何使用ChatGPT為大疆Tello無人機編寫“找飲料”程序的案例。&n