馬斯克說到做到 Grok遵照Apache 2.0協議開放模型權重和架構


6個月掏出3410億參數自研大模型,馬斯克說到做到!就在剛剛,馬斯克的AI創企xAI正式發佈此前備受期待大模型Grok-1,其參數量達到3140億,遠超OpenAIGPT-3.5的1750億。這是迄今參數量最大的開源大語言模型,遵照Apache2.0協議開放模型權重和架構。

STK262_GROK_B.webp

8591-cb52508a23b46bb2112b75c34215e491.png

Grok-1是一個混合專傢(Mixture-of-Experts,MOE)大模型,這種MOE架構重點在於提高大模型的訓練和推理效率,形象地理解,MOE就像把各個領域的“專傢”集合到一起,遇到任務派發給不同領域的專傢,最後匯總結論,提升效率。決定每個專傢做什麼的是被稱為“門控網絡”的機制。

xAI已經將Grok-1的權重和架構在GitHub上開源。


目前Grok-1的源權重數據大小大約為300GB。

截至北京時間3月18日上午7時許,Grok-1項目收獲3400顆星。


Grok-1是馬斯克xAI自2023年7月12日成立以來發佈的首個自研大模型。xAI特別強調說這是他們自己從頭訓練的大模型。Grok-1沒有針對特定應用進行微調。

xAI是馬斯克去年剛剛成立的明星AI創企,其目的之一就是與OpenAI、Google、微軟等對手在大模型領域進行競爭,其團隊來自OpenAI、GoogleDeepMind、Google研究院、微軟研究院等諸多知名企業和研究機構。

此前馬斯克剛剛“怒噴”OpenAI不夠“Open”,後腳這就開源自傢的頂級3410億參數自研大模型Grok-1。雖然馬斯克在預熱到發佈的過程中也“放幾次鴿子”,但最終他並沒有食言。

今天,xAI還公佈Grok-1的更多細節:

基礎模型基於大量文本數據訓練,未針對特定任務進行微調。

3140億參數的Mixture-of-Experts模型,其對於每個token,活躍權重比例為25%。

xAI從2023年10月開始使用自定義訓練堆棧在JAX和Rust之上從頭開始訓練。

但此次xAI並沒有放出Grok-1的具體測試成績,其與OpenAI即將發佈的GPT-5的大模型王者之戰,必將成為業內關註的焦點。

當然,馬斯克發大模型,怎麼會少的大佬隔空對線“互懟”?

xAI官方消息剛剛發佈,ChatGPT的官方賬號馬上就跟馬斯克在X平臺上進行互動,在Grok官方賬號評論下回復道:“偷我的笑話。”


馬斯克自然不會示弱,馬上說請告訴我OpenAI“Open”之處在哪裡。

馬斯克高仿號也馬上跑過來添油加醋,說我們都知道是Sam在運營ChatGPT的賬號。

值得一提的是,此次xAI發佈Grok-1消息的封面圖片,是由Midjourney生成,Grok給出提示文本:一個神經網絡的3D插圖,具有透明節點和發光連接,展示不同粗細和顏色的連接線的不同權重(A 3D illustration of a neural network, with transparent nodes and glowing connections, showcasing the varying weights as different thicknesses and colors of the connecting lines)。

原圖:

無標題.jpeg


相關推薦

2024-03-18

快科技3月18日消息,據媒體報道,馬斯克的AI創企xAI正式宣佈其大語言模型Grok-1已實現開源,並向公眾開放下載。據解,Grok-1是一款基於混合專傢系統(Mixture-of-Experts,MoE)技術構建的大語言模型,擁有3140億參數,遠超OpenAI GPT-3

2024-03-18

似乎是為表明自己始終堅持對AI模型開源,馬斯克做出與阿爾特曼全然不同的選擇。3月17日,馬斯克宣佈開源Grok-1,這使得Grok-1成為當前參數量最大的開源大語言模型,擁有3140億參數,遠超OpenAIGPT-3.5的1750億。有意思的是,Grok-1

2024-03-18

今天凌晨,馬斯克旗下AI大模型Grok宣佈正式開源。險而又險地保住他在3月11日發佈的“本周開源”預告。這是一個3140億參數的混合專傢(MoE)模型,項目發佈5個小時,已在GitHub收獲6.3k星。對此,有DeepMind研究工程師預測,Grok-1

2023-11-06

馬斯克突然出手截胡,搶在OpenAI開發者大會前發佈大模型Grok。與其他ChatGPT類產品不同,Grok可以實時從推文中獲取最新知識,比如馬斯克剛剛與JoeRogan的最新訪談。巨量、實時且獨特的數據構成Grok的最大護城河,早在7月馬斯克

2024-03-21

3月11日周一,馬斯克發推文說要在一周內開源Grok。眾多開發者等著盼著過一周,到周日Grok才正式將代碼推到開源社區。開源的Grok-1是一個基於Transformer架構的自回歸模型,參數規模達到3140億參數,是目前參數量最大的開源模型

2023-12-06

間周二,美國證交會官網出現一份信披文件,首度披露馬斯克麾下xAI的融資規模細節。作為OpenAI曾經的聯合創始人,以及如今積極的批評者,馬斯克在今年4月將推特改名為X公司時,也順手註冊xAI公司。雖然馬斯克是世界首富,

2023-11-06

馬斯克傢的類ChatGPT產品發佈,很像他。當地時間11月4日,馬斯克的人工智能公司xAI宣佈推出其首款產品Grok——一款對標ChatGPT的聊天機器人。“幽默感”是Grok的一大特色,馬斯克在X平臺(原Twitter)上分享Grok的問答截圖。當用

2024-03-09

馬斯克起訴OpenAI事件已經發酵一周。3月7日,馬斯克在推特上稱,如果OpenAI把名字改為ClosedAI他就撤銷訴訟,暗諷OpenAI的不開源行為。此前,OpenAI公佈馬斯克與包括山姆·阿爾特曼在內的OpenAI聯合創始人的郵件對話,逐一駁回馬斯

2023-11-08

過去這個周末,馬斯克發佈他的首個AI大語言模型Grok,宣稱很多方面都是業界最佳。但僅僅一天後,OpenAI就向業界展示更大的生態平臺野心,他們已經在生成式AI的行業競爭中占據著明顯的領先優勢。向來習慣引領行業的馬斯克

2023-11-05

進行會話式問答,還能實時抓取X(推特)平臺內容。馬斯克自己的人工智能公司xAI正在推出自己的大型語言模型,其中的重要功能之一是能夠實時抓取X(推特)平臺內容。周五,馬斯克發表推文稱,xAI將發佈其首個人工智能產

2024-04-09

當地時間周一(4月8日),特斯拉CEO埃隆·馬斯克預測稱,到明年或2026年,人工智能(AI)可能會比最聰明的人類更聰明。馬斯克周一在X(前身為推特)語音空間上接受挪威主權財富基金首席執行官NicolaiTangen的采訪。當被問及通

2023-11-06

據報道,特斯拉CEO埃隆·馬斯克(ElonMusk)今日表示,旗下人工智能初創公司xAI將被整合到他的社交媒體平臺X(推特)中,同時還將作為一個獨立的應用程序提供。馬斯克還稱,xAI已經發佈其首款人工智能聊天機器人Grok。上周五

2024-03-27

繼埃隆-馬斯克(ElonMusk)的xAI在3月早些時候開源其Grok大型語言模型之後,這位X的所有者周二表示,X將很快向更多付費用戶提供Grok聊天機器人。馬斯克在X上發佈的一篇文章中宣佈,Grok將於本周向Premium用戶開放,而不是像以前

2023-11-06

等。從中不難看出,從小就是道格拉斯科幻作品粉絲的馬斯克,選用這個詞來命名大模型的用意。(來源:xAI)xAI團隊介紹稱,這個AI旨在回答所有幾乎所有的問題,甚至還會建議該問什麼樣的問題。該團隊同時“警告”稱,這