馬斯克、OpenAI決裂背後,大模型應該開源還是閉源?


馬斯克起訴OpenAI事件已經發酵一周。3月7日,馬斯克在推特上稱,如果OpenAI把名字改為ClosedAI他就撤銷訴訟,暗諷OpenAI的不開源行為。此前,OpenAI公佈馬斯克與包括山姆·阿爾特曼在內的OpenAI聯合創始人的郵件對話,逐一駁回馬斯克的指控,並暗指其唯利是圖。

圖片來源:每經記者 劉雪梅 攝

此次糾紛的焦點之一是馬斯克對OpenAI的開源要求。而這背後所折射出的也是AI浪潮下科學界的長期爭論話題——到底應該開源還是閉源?

紐約大學坦登工程學院計算機科學與工程系副教授Julian Togelius在接受《每日經濟新聞》記者采訪時表示,開源是大勢所趨。“開源對於防止權力集中很重要。到目前為止,每個大型模型都在某種程度上是‘可越獄的’。”

馬薩諸塞大學洛厄爾分校計算機科學教授Jie Wang則對每經記者表示,“未來各主要參與者都會將其大模型的某些部分開源,但絕對不是最重要的部分,例如用於訓練其大語言模型和預訓練模型權重的完整數據集。這或多或少類似於Meta開源LLaMA的方式。”

AI巨頭的決裂

2月29日,馬斯克在舊金山法院對OpenAI及公司CEO阿爾特曼和總裁佈羅克曼提起訴訟,震驚全球科技圈。在馬斯克的起訴書中,他斥責OpenAI違背“初心”,要求OpenAI恢復開源並給予賠償。

3月5日,OpenAI曝光馬斯克與他們的大量往來郵件,稱馬斯克提議 OpenAI 與特斯拉合並或由他完全控制,但雙方未能就盈利性實體的條款達成一致。3月6日,馬斯克在Twitter上回復,“如何OpenAI改名為ClosedAI,我就撤銷訴訟。”

圖片來源:每經制圖
圖片來源:每經制圖

9年前,正是在AI上志同道合,馬斯克和阿爾特曼等人攜手創辦非營利性AI研究實驗室“OpenAI”來對抗以Google為代表的科技巨頭。而如今,馬斯克與阿爾特曼及其所在的OpenAI徹底決裂,雙方舊日堅持的“初心”成為矛盾焦點。

在OpenAI的官網主頁上寫著,“我們的使命是確保通用人工智能(AGI)造福全人類。”最初,OpenAI的確作為一個非營利組織堅持著這樣的路線。而自GPT-2後,OpenAI采取閉源策略,公司出售大模型API訪問權限,但不再發佈有關其訓練數據和模型架構的詳細信息。

2019年,阿爾特曼還組建一個由OpenAI非營利組織管理的營利性實體,以便從微軟等外部投資者那裡籌集資金。對此,OpenAI在5日發文時曾解釋,這是因為“開發 AGI 所需的資源遠超過最初預期”。

隨著OpenAI核心技術不再開源,且與微軟的關系越來越密切時,馬斯克的不滿可想而知。馬斯克在起訴書中批評稱:“OpenAI已經變成全球最大技術公司微軟事實上的閉源子公司。在其新董事會的領導下,OpenAI不僅在開發,而且實際上正在完善一種AGI,以最大化微軟的利潤,而不是造福人類。”

背後是開源閉源路線之爭

在雙方的爭端中,一個值得關註的點是,馬斯克要求OpenAI恢復開源。這折射出的也是AI浪潮下的一個爭議性話題——到底應該開源還是閉源?

在開源閉源之爭上,馬斯克堅定地選擇前者。

《每日經濟新聞》記者註意到,馬斯克旗下特斯拉的核心技術就已經在全球范圍內開源。根據新加坡咨詢公司GreyB的統計,截至2023年末,全球范圍內特斯拉共擁有專利3304項(不包含審批中專利),其中有2397項仍然有效。據媒體統計,刨除重復的情況,特斯拉共有222項開放專利。從技術類別上看,特斯拉開放的專利屬於比較核心的專利。

圖片來源:GreyB網站
圖片來源:GreyB網站

馬斯克旗下另一傢公司SpaceX也曾公開猛禽發動機圖紙。在去年12月接受外媒采訪時,馬斯克曾透露,“SpaceX不使用(獨占)專利,完全開放。”

而將視角放大到整個科技界,開源還是閉源也是一直爭論不休的話題。2023年10月31日,“開源派”曾簽署一份呼籲AI研發更加開放的聯名信,截至發稿,1821名專傢都簽下名字。

圖片來源:mozilla官網
圖片來源:mozilla官網

“開源對於防止權力集中很重要,我們不希望未來隻有少數財力雄厚的科技公司才能控制前沿模型。” 紐約大學坦登工程學院計算機科學與工程系副教授Julian Togelius在接受《每日經濟新聞》記者采訪時表示。“到目前為止,每個大型模型都在某種程度上是‘可越獄的’。(開源讓)我們解其弱點,才能知道如何更好地部署模型。”(註:“越獄”指的是通過提示註入技術修改模型的行為。)

馬薩諸塞大學洛厄爾分校計算機科學教授Jie Wang也對每經記者稱,“開源代碼可以提高透明度並有助於推進技術,世界各地的相關方可以幫助識別開發團隊未能發現的代碼中的潛在陷阱,並提供更正。這有助於降低代碼可能執行有害操作的風險。”不過,他也指出,開源並不是解決所有安全問題的靈丹妙藥。

而反對開源的一派認為,開源AI會被不良行為者操縱。去年10月20日,來自麻省理工學院和劍橋大學的科學傢們發表一篇論文,他們通過實驗研究持續模型權重的擴散是否會幫助惡意者利用更強大的未來模型來造成大規模傷害,結果發現,開源大模型的確可能存在風險。

Jie Wang對記者表示,“不同的態度取決於不同的身份。學術研究人員希望AI技術是開源的,以便可以評估和修改代碼。另一方面,企業傢可能為保護投資和業務,而不願意開放源代碼。”

科技巨頭與AI新貴在開源或閉源的問題上也采取不同的路線。前者最近在互聯網上免費提供其生成式AI的代碼,例如,目前開源大模型被Meta的Llama主導,許多開源模型都是基於Llama而開發;後者如OpenAI和Anthropic則出售專有AI模型的API訪問權限,但不共享代碼。

OpenAI和Anthropic高管認為,政府應該監管最強大的AI模型,這樣壞人就不能輕易利用它們。今年1月,Anthropic 公司研究人員還發表論文警告稱,AI中毒可能導致開源大模型變成潛伏的間諜。

圖片來源:arxiv.org
圖片來源:arxiv.org

但在去年9月的美國參議院人工智能洞察論壇上,Meta首席執行官馬克·紮克伯格等人卻認為,開源模式對美國保持競爭力至關重要,科技行業可以解決對開源模式安全的擔憂。

若實現AGI,是否需要開源?

“開源是大勢所趨,我認為Meta正在引領這一趨勢,其次是Mistral AI、HuggingFace等規模較小的公司。” Julian Togelius告訴《每日經濟新聞》記者。

盡管Mistral AI最初推出開源模型,隨著規模的擴大,其作風似乎越來越像OpenAI靠近,采取閉源路線。對此,Togelius表示,“他們需要以某種方式賺錢,但目前還不清楚如何在這個領域最好地賺錢,但Mistral AI比 OpenAI 幾乎不開源的情況要好得多。”

而大型科技巨頭Google近日的動作似乎也是對Togelius言論的驗證。今年2月,Google罕見地改變去年堅持的大模型閉源策略,推出“開源”大模型Gemma。有報道認為,Gemma代表Google大模型策略的轉變——兼顧開源和閉源,開源主打性能最強大的小規模模型,希望戰勝Meta和Mistral AI;閉源則主打規模大的效果最好的大模型,希望盡快追上OpenAI。

去年5月,一份Google的內部文件曾在網上激起千層浪。文件認為,開源大模型迅猛發展,正在侵蝕OpenAI和Google的陣地。除非改變閉源的立場,否則開源替代品將最終使這兩傢公司黯然失色。“雖然我們的模型在質量方面仍略占優勢,但(閉源和開源模型)的差距正在以驚人的速度縮小。”文件寫道。

“這(指的是Google的新舉措)對研究和開發人員來說的確是個好消息。”Jie Wang對每經記者說道。“不過我懷疑Google是否會將一切開源。我認為未來各個主要參與者都會將其大模型的某些部分開源,以便研究人員和開發人員解模型的架構和訓練過程,但從業務角度來看絕對不是最重要的部分,例如用於訓練其 LLM 和預訓練模型權重的完整數據集。這或多或少類似於Meta開源LLaMA的方式。”

而在對OpenAI的起訴書中,馬斯克還提到對AGI(通用人工智能)的擔憂。當被問及若達到AGI,是否需要開源時,Julian Togelius表示,“我不認為AGI是一個定義特別明確或有用的概念。如果你 5 年前向某人展示 Claude 3 或 GPT-4,他們可能會認為我們已經實現 AGI。盡管如此,還有很多事情是大模型無法做到的。”

Togelius認為,OpenAI可能最終不會選擇開源,“因為這將決定性地改變我們對風險計算的看法,並最終消除人們認為OpenAI具有某種秘密武器的傾向(事實並非如此,Google 和 Anthropic 都擁有相似強度的模型)。”

Jie Wang也向記者表示,“除非有一個可執行的國際法要求所有AI技術必須開源,而如何強制執行是另一個具有挑戰性的問題,我對OpenAI 是否會開源一切持懷疑態度。”


相關推薦

2024-03-08

展出自有的專有系統。此場辯論起因於特斯拉CEO埃隆·馬斯克(Elon Musk)對OpenAI及其CEO薩姆·奧特曼(Sam Altman)的起訴,凸顯人工智能的部署和安全問題的復雜性,特別是在監管機構、大型科技公司和科學傢等對人工智能的發展

2024-04-19

大模型要不要開源?這個問題還可以引申出另外一個討論:大模型是開源好還是閉源好?過去很長一段時間,“大模型開源or閉源”之爭一直是業界熱門議題。最近,百度董事長李彥宏連續兩次表態站隊大模型閉源,再度引發行

2024-03-18

今天凌晨,馬斯克旗下AI大模型Grok宣佈正式開源。險而又險地保住他在3月11日發佈的“本周開源”預告。這是一個3140億參數的混合專傢(MoE)模型,項目發佈5個小時,已在GitHub收獲6.3k星。對此,有DeepMind研究工程師預測,Grok-1

2024-03-08

成一種共生關系。”山姆·奧特曼說完之後看向埃隆·馬斯克。後者接過話頭,“我同意山姆所說的,我們已經像賽博格一樣工作。不過需要謹慎對待人工智能的發展,確保它最終對人類有利。”上述對話發生在9年前,兩人在美

2024-02-22

我出炸彈。這不,又一個深夜炸彈。2月21日,在與閉源的OpenAI打得火熱的同時,Google突然加入開源的戰局。北京時間夜間Google突然宣佈,開源一個新的模型系列Gemma,這個模型使用與它最強的Gemini同源的技術,並且在一系列的標

2023-04-19

埃隆·馬斯克表示,美國人工智能研究公司OpenAI發展至今並非他所想,這在一定程度上是他的錯。當地時間周一晚上,他在接受媒體采訪時表示,OpenAI的發展沒有達到他的預期。2015年,馬斯克與他人共同創建ChatGPT制造商OpenAI,

2024-03-18

如果全世界隻有一傢公司能趕超OpenAI,那Google應該是第一。最近,Google重磅發佈一篇論文報告,裡面提出一種名為“模型竊取”的技術。通過模型竊取技術,Google成功破解ChatGPT基礎模型Ada和Babbage的投影矩陣,甚至連內部隱藏維

2023-04-19

埃隆•馬斯克正計劃推出人工智能初創公司,和ChatGPT展開競爭,這一報道得到馬斯克的證實。他說要開啟一個叫TruthGPT的項目,是個試圖理解宇宙本質、最大程度尋求真理的AI。3月初,馬斯克在美國內華達州註冊創建一傢名為“

2023-11-09

是由Meta在今年2月推出的Llama。當時全球科技公司都盯著OpenAI,試圖追趕閉源的ChatGPT。但開源讓Meta坐上牌桌,吸引大量開發者,一時名聲大噪。國內公司很快跟上,搶抓第一波關註度。智譜AI、智源研究院、百川智能,是動作最

2024-03-02

馬斯克和OpenAI要對簿公堂?!北京時間周五下午,馬斯克又搞大事!一紙訴狀將OpenAI告上法院。馬斯克向舊金山高等法院提起訴訟,以違反合同為由,狀告OpenAICEO薩姆·阿爾特曼(SamAltman),OpenAI聯合創始人、總裁格雷格·佈羅

2024-02-27

Mistral AI合作的消息,並評論稱:“這可能是原因。”馬斯克回應稱:“是微軟讓他們閉源的?”            

2024-03-05

馬斯克的一紙訴狀再次將OpenAI推上風口浪尖,或許還把GPT-5的發佈時間推遲。具體詳情可回顧先前的文章,這場官司的焦點主要歸納為以下幾個方面:OpenAI 的開源承諾和實際行動之間的矛盾:OpenAI 與微軟的合作是否背離其最初

2024-03-21

3月11日周一,馬斯克發推文說要在一周內開源Grok。眾多開發者等著盼著過一周,到周日Grok才正式將代碼推到開源社區。開源的Grok-1是一個基於Transformer架構的自回歸模型,參數規模達到3140億參數,是目前參數量最大的開源模型

2024-04-12

的一次內部講話中,李彥宏首次回應為什麼不開源文心大模型。李彥宏表示,一年前文心剛剛發佈的時候是有過非常激烈的討論的,但最終還是選擇不開源,因為當時的判斷是,市場上一定會有不止一傢會開源。“在這種情況下