馬斯克用行動反擊 開源自傢頂級大模型 壓力給到OpenAI


似乎是為表明自己始終堅持對AI模型開源,馬斯克做出與阿爾特曼全然不同的選擇。3月17日,馬斯克宣佈開源Grok-1,這使得Grok-1成為當前參數量最大的開源大語言模型,擁有3140億參數,遠超OpenAIGPT-3.5的1750億。

有意思的是,Grok-1宣佈開源的封面圖為Midjourney生成,可謂“AI helps AI”。


一直吐槽OpenAI不open的馬斯克,自然要在社交平臺上含沙射影一番,“我們想解更多OpenAI的開放部分。”


Grok-1遵照Apache 2.0協議開放模型權重和架構。這意味著它允許用戶自由地使用、修改和分發軟件,無論是個人還是商業用途。這種開放性鼓勵更廣泛的研究和應用開發。項目發佈至今,已經在GitHub上攬獲6.5k星標,熱度還在持續增加。


項目說明中明確強調,由於Grok-1是一個規模較大(314B參數)的模型,需要有足夠GPU內存的機器才能使用示例代碼測試模型。網友表示這可能需要一臺擁有628 GB GPU內存的機器。

此外,該存儲庫中MoE層的實現效率並不高,之所以選擇該實現是為避免需要自定義內核來驗證模型的正確性。

目前已開源的熱門大模型包括Meta的Llama2、法國的Mistral等。通常來說,發佈開源模型有助於社區展開大規模的測試和反饋,意味著模型本身的迭代速度也能加快。

Grok-1是一個混合專傢(Mixture-of-Experts,MOE)大模型,由馬斯克旗下的AI創企xAI在過去4個月裡開發。回顧該模型的開發歷程:

在宣佈成立xAI之後,相關研究人員首先訓練一個330億參數的原型語言模型(Grok-0),這個模型在標準語言模型測試基準上接近LLaMA2(70B)的能力,但使用更少的訓練資源;

之後,研究人員對模型的推理和編碼能力進行重大改進,最終開發出Grok-1並於2023年11月發佈,這是一款功能更為強大的SOTA語言模型,在HumanEval編碼任務中達到63.2%的成績,在MMLU中達到73%,超過其計算類中的所有其他模型,包括ChatGPT-3.5和Inflection-1。

與其他大模型相比,Grok-1的優勢在哪呢?

xAI特別強調,Grok-1是他們自己從頭訓練的大模型,即從2023年10月開始使用自定義訓練堆棧在JAX和Rust上訓練,沒有針對特定任務(如對話)進行微調;

Grok-1的一個獨特而基本的優勢是,它可以通過X平臺實時解世界,這使得它能夠回答被大多數其他AI系統拒絕的辛辣問題。Grok-1發佈版本所使用的訓練數據來自截至2023年第三季度的互聯網數據和xAI的AI訓練師提供的數據;

3140億參數的Mixture-of-Experts模型,其對於每個token,活躍權重比例為25%,這一龐大的參數量為其提供強大的語言理解和生成能力。

xAI此前介紹,Grok-1將作為Grok背後的引擎,用於自然語言處理任務,包括問答、信息檢索、創意寫作和編碼輔助。未來,長上下文的理解與檢索、多模態能力都是該模型將會探索的方向之一。


相關推薦

2023-11-27

orShares Gerber Kawasaki ETF的第三大重倉股,權重為7.73%。在馬斯克最近發帖支持所謂“反猶”言論引發爭議後,格伯曾強烈批評馬斯克,稱他的所作所為對特斯拉品牌造成巨大損害,並聲稱要賣掉自己現在開的特斯拉Model Y,換成一

2024-03-18

6個月掏出3410億參數自研大模型,馬斯克說到做到!就在剛剛,馬斯克的AI創企xAI正式發佈此前備受期待大模型Grok-1,其參數量達到3140億,遠超OpenAIGPT-3.5的1750億。這是迄今參數量最大的開源大語言模型,遵照Apache2.0協議開放模

2022-11-16

在移動芯片市場,聯發科已經保持8個季度的第一,他們的滿足感並不止於此。在日前舉辦的一場峰會上,聯發科副總表示,PC是規模400億美元的巨大市場,聯發科計劃涉足高功耗市場,將不少已經應用於手機的移動技術如5G、藍

2023-04-15

鳳凰網科技訊 北京時間4月15日消息,埃隆馬斯克(Elon Musk)尋求加入矽谷在生成式人工智能(AI)系統領域的競賽,目前正在制定計劃成立一傢新的AI創業公司,與ChatGPT開發商OpenAI競爭。知情人士透露,馬斯克正在組建一個由AI研究人

2023-04-15

鳳凰網科技訊 北京時間4月15日消息,埃隆馬斯克(Elon Musk)尋求加入矽谷在生成式人工智能(AI)系統領域的競賽,目前正在制定計劃成立一傢新的AI創業公司,與ChatGPT開發商OpenAI競爭。知情人士透露,馬斯克正在組建一個由AI研

2024-03-18

最近,Google重磅發佈一篇論文報告,裡面提出一種名為“模型竊取”的技術。通過模型竊取技術,Google成功破解ChatGPT基礎模型Ada和Babbage的投影矩陣,甚至連內部隱藏維度的關鍵信息也是直接破獲,分別是1024和2048。這一發現猶

2024-03-12

3月12日消息,人工智能初創企業OpenAI對億萬富翁埃隆·馬斯克(ElonMusk)的指控做出措辭嚴厲的反擊,並在法庭文件中表明,馬斯克的指控“建立在令人費解的、往往自相矛盾的事實基礎之上”。這份文件是OpenAI針對馬斯克今年2

2023-11-08

過去這個周末,馬斯克發佈他的首個AI大語言模型Grok,宣稱很多方面都是業界最佳。但僅僅一天後,OpenAI就向業界展示更大的生態平臺野心,他們已經在生成式AI的行業競爭中占據著明顯的領先優勢。向來習慣引領行業的馬斯克

2023-11-22

被動為主動,這個回擊力度和反應速度或許連喬佈斯、馬斯克都自愧不如。支撐他翻盤的,是他在OpenAI“主心骨”的地位,也是OpenAI的“金主”微軟。ChatGPT的成功讓OpenAI成為炙手可熱的獨角獸,微軟及管理層對OpenAI,尤其是阿

2023-03-27

“馬斯克是個混蛋(Jerk),他說的大部分都不是真的,而且他自己清楚這一點。”面對馬斯克的持續公開批評,OpenAI創始人兼CEO艾特曼(SamAltman)終於打破沉默,站出來一一回應馬斯克的指責。馬斯克原本是ChatGPT的最大支持者

2024-04-23

無法一路無阻地持續攀升,AGI的確短時期不會實現,而馬斯克的預言卻完全相反,馬斯克認為明年底人工智能就會超過所有人類,馬斯克也表達未來10年人形機器人部署和產量將會超過iPhone,這與Jim Fan的觀點一致。目前Llama 3 70B

2024-07-05

,可能會進一步改變現有的合作關系。不僅如此,蘋果自傢頂級AI模型方面一旦成功,也可能會減少其對OpenAI等合作夥伴的依賴,為AI行業帶來新的變數。

2023-01-29

曾領導推特的機器學習倫理團隊,直到去年11月埃隆·馬斯克(Elon Musk)解散該團隊。她表示,她預計谷歌等公司在爭先恐後地追趕OpenAI的過程中,將越來越多地將內部批評者和倫理學傢排擠在外。她說:“我們原來以為是中國

2024-03-08

成一種共生關系。”山姆·奧特曼說完之後看向埃隆·馬斯克。後者接過話頭,“我同意山姆所說的,我們已經像賽博格一樣工作。不過需要謹慎對待人工智能的發展,確保它最終對人類有利。”上述對話發生在9年前,兩人在美