Meta確認其Llama 3開源大語言模型將於下個月推出


在本周二於倫敦舉行的一次活動上,Meta公司證實,它計劃在下個月內首次發佈Llama3(用於支持生成式人工智能助手的下一代大型語言模型)。這證實TheInformation周一發表的一篇報道。

IMG_4295.jpg

Meta 公司全球事務總裁尼克-克萊格(Nick Clegg)說:"我們希望在下個月內,甚至更短的時間內,開始推出我們新的下一代基礎模型套件 Llama 3。"他的描述聽起來像是要發佈該產品的幾個不同迭代或版本。"今年內,我們將發佈一系列具有不同功能、不同通用性的模型,很快就會開始發佈。"

Meta 首席產品官 Chris Cox 補充說,計劃用 Llama 3 支持 Meta 的多個產品。

一年多前,OpenAI 推出 ChatGPT,並將人工智能生成式問答變成日常的主流體驗,這讓 Meta 和Google等其他大型科技公司措手不及。

Meta 公司在人工智能方面基本上采取非常謹慎的態度,但這並沒有得到公眾的認可,以前版本的 Llama 被批評為能力過於有限。(Llama 2於 2023 年 7 月公開發佈)。第一版 Llama 並未對外發佈,但仍在網上泄露)。

與前幾代產品相比,Llama 3 的功能更強大,不僅能更準確地回答問題,還能回答更廣泛的問題,其中可能包括更具爭議性的話題。該公司希望這將使產品受到用戶的歡迎。

"隨著時間的推移,我們的目標是讓由 Llama 驅動的 Meta AI 成為世界上最有用的助手,"人工智能研究副總裁 Joelle Pineau 說。"要達到這個目標,還有相當多的工作要做。"

該公司沒有談及《Llama 3》中使用的參數的大小,也沒有提供它將如何工作的任何演示。預計它將擁有約 1400 億個參數,而最大的 Llama 2 型號隻有 700 億個參數。

最值得註意的是,Meta 的 Llama 系列是作為開源產品構建的,代表一種不同的哲學方法,即人工智能作為一種更廣泛的技術應如何發展。與專有模式相比,Meta 希望通過這種方式獲得更多開發者的青睞。

但 Meta 似乎也在謹慎行事,尤其是在文本生成之外的其他生成式人工智能方面。皮諾說,公司尚未發佈圖像生成工具 Emu。

考克斯說:"延遲、安全性和易用性都非常重要,隻有這樣才能生成令你自豪的圖像,並代表你的創意背景。"

具有諷刺意味的是,或者可以說是意料之中的,即使在 Meta 公司努力推出 Llama 3 的同時,公司內部也有一些對生成式人工智能持懷疑態度的重要人士。兼任 Meta 首席人工智能科學傢的著名人工智能學者 Yann LeCun 對生成式人工智能的整體局限性進行抨擊,並表示他將賭註押在生成式人工智能之後。他預測這將是聯合嵌入式預測架構(JEPA),這是一種訓練模型和產生結果的不同方法,Meta 公司一直在使用這種方法在圖像生成領域構建更準確的預測性人工智能。

"人工智能的未來是 JEPA。它不是生成式人工智能,"他說。"我們得給克裡斯的產品部門改個名字"。


相關推薦

2023-11-09

於“第一”太多,榜單都快不夠用。比如最近,昆侖萬維開源‘天工’系列大模型,號稱多榜超越Llama 2;李開復的零一萬物公司發佈開源大模型“Yi”,“問鼎”全球多項榜單;vivo發佈自研AI“藍心”大模型,是國內“首傢”開

2023-02-25

天,Meta終於官宣自傢的大語言模型,並且會向AI研究人員開源。今天,Meta終於向全世界證明:自己是有正經研究AI的!眼看微軟、Google、OpenAI這一陣子掙足眼球,Meta也坐不住。2月24日,小紮官宣下場:我們有全新的SOTA大語言模

2024-04-19

沒有出乎太多意外,Meta帶著號稱“有史以來最強大的開源大模型”Llama3系列模型來“炸街”。具體來說,Meta本次開源8B和70B兩款不同規模的模型。Llama38B:基本上與最大的Llama270B一樣強大。Llama 3 70B: 第一檔 AI 模型,媲美 Gemini 1

2024-03-18

面受挫,敲響開閉源警鐘既然封閉的大模型都無法幸免,開源的大模型又會如何呢?基於這一點,Google針對不同規模和結構的開源模型進行一系列實驗,比如GPT-2的不同版本和LLaMA系列模型。要知道,GPT-2是一個開源的預訓練語言

2024-02-22

一年後,一傢相對不知名的中國創業公司躍居到一項評估開源人工智能系統能力的排行榜榜首。它就是知名風投人士李開復創立的零一萬物(01.AI)。當時,零一萬物剛剛成立8個月時間,但擁有財力雄厚的投資者,已經是估值達到1

2024-04-19

AI圈又迎來一件大事:Meta正式發佈他們迄今最強的新一代開源大語言模型Llama3。首批發佈的Llama38B和Llama370B包括預訓練和指令微調版本,8K上下文,在兩個24KGPU定制集群上使用15萬億tokens數據訓練而成,Meta稱它們分別是80億和700億

2024-02-27

一聲炸雷深夜炸響,谷歌居然也開源LLM?!這次,重磅開源的Gemma有2B和7B兩種規模,並且采用與Gemini相同的研究和技術構建。有Gemini同源技術的加持,Gemma不僅在相同的規模下實現SOTA的性能。而且更令人印象深刻的是,還能在關

2024-02-29

劃在7月發佈Llama 3,但發佈時間表仍可能調整。作為一款開源大語言模型,Llama 3不僅將支持Meta旗下的人工智能助手,還將向外部開發者免費提供,以便他們開發自己的聊天機器人。隨著Meta試圖使Llama3在處理難題時更加自由,這

2024-03-21

3月11日周一,馬斯克發推文說要在一周內開源Grok。眾多開發者等著盼著過一周,到周日Grok才正式將代碼推到開源社區。開源的Grok-1是一個基於Transformer架構的自回歸模型,參數規模達到3140億參數,是目前參數量最大的開源模型

2024-02-22

昨日晚間,Google毫無預兆地發佈開源模型Gemma,直接狙擊Llama2,繼通過Gemini拳打OpenAI後,試圖用Gemma腳踢Meta。不同於Gemini的“全傢桶”路線,Gemma主打輕量級、高性能,有20億、70億兩種參數規模,能在筆記本電腦、臺式機、物聯

2023-08-10

程之中,以提高效率並帶來先進的功能。IBM表示,Meta的開源人工智能模型發佈後,還將推出更多軟件,如人工智能調整工作室、情況說明書和其他生成式人工智能模型。Llama 2是Meta於今年 7 月推出的開源人工智能語言模型的商業

2024-03-09

如果OpenAI把名字改為ClosedAI他就撤銷訴訟,暗諷OpenAI的不開源行為。此前,OpenAI公佈馬斯克與包括山姆·阿爾特曼在內的OpenAI聯合創始人的郵件對話,逐一駁回馬斯克的指控,並暗指其唯利是圖。此次糾紛的焦點之一是馬斯克對Op

2024-04-09

AI芯片,以進一步加速公司在AI領域內的擴張。Meta發言人確認該計劃屬實,稱該芯片將與Meta采購到的數十萬個GPU協同工作。此前,早在去年五月,Meta稱其已經開始打造並改進定制芯片MTIA,用於加快生成式AI模型研發,優化推理

2024-03-18

似乎是為表明自己始終堅持對AI模型開源,馬斯克做出與阿爾特曼全然不同的選擇。3月17日,馬斯克宣佈開源Grok-1,這使得Grok-1成為當前參數量最大的開源大語言模型,擁有3140億參數,遠超OpenAIGPT-3.5的1750億。有意思的是,Grok-1