馬斯克、OpenAI決裂背後，大模型應該開源還是閉源？

2024-03-09 來自每日經濟新聞發表於業界精選

馬斯克起訴OpenAI事件已經發酵一周。3月7日，馬斯克在推特上稱，如果OpenAI把名字改為ClosedAI他就撤銷訴訟，暗諷OpenAI的不開源行為。此前，OpenAI公佈馬斯克與包括山姆·阿爾特曼在內的OpenAI聯合創始人的郵件對話，逐一駁回馬斯克的指控，並暗指其唯利是圖。

圖片來源：每經記者劉雪梅攝

此次糾紛的焦點之一是馬斯克對OpenAI的開源要求。而這背後所折射出的也是AI浪潮下科學界的長期爭論話題——到底應該開源還是閉源？

紐約大學坦登工程學院計算機科學與工程系副教授Julian Togelius在接受《每日經濟新聞》記者采訪時表示，開源是大勢所趨。“開源對於防止權力集中很重要。到目前為止，每個大型模型都在某種程度上是‘可越獄的’。”

馬薩諸塞大學洛厄爾分校計算機科學教授Jie Wang則對每經記者表示，“未來各主要參與者都會將其大模型的某些部分開源，但絕對不是最重要的部分，例如用於訓練其大語言模型和預訓練模型權重的完整數據集。這或多或少類似於Meta開源LLaMA的方式。”

AI巨頭的決裂

2月29日，馬斯克在舊金山法院對OpenAI及公司CEO阿爾特曼和總裁佈羅克曼提起訴訟，震驚全球科技圈。在馬斯克的起訴書中，他斥責OpenAI違背“初心”，要求OpenAI恢復開源並給予賠償。

3月5日，OpenAI曝光馬斯克與他們的大量往來郵件，稱馬斯克提議 OpenAI 與特斯拉合並或由他完全控制，但雙方未能就盈利性實體的條款達成一致。3月6日，馬斯克在Twitter上回復，“如何OpenAI改名為ClosedAI，我就撤銷訴訟。”

圖片來源：每經制圖

9年前，正是在AI上志同道合，馬斯克和阿爾特曼等人攜手創辦非營利性AI研究實驗室“OpenAI”來對抗以Google為代表的科技巨頭。而如今，馬斯克與阿爾特曼及其所在的OpenAI徹底決裂，雙方舊日堅持的“初心”成為矛盾焦點。

在OpenAI的官網主頁上寫著，“我們的使命是確保通用人工智能（AGI）造福全人類。”最初，OpenAI的確作為一個非營利組織堅持著這樣的路線。而自GPT-2後，OpenAI采取閉源策略，公司出售大模型API訪問權限，但不再發佈有關其訓練數據和模型架構的詳細信息。

2019年，阿爾特曼還組建一個由OpenAI非營利組織管理的營利性實體，以便從微軟等外部投資者那裡籌集資金。對此，OpenAI在5日發文時曾解釋，這是因為“開發 AGI 所需的資源遠超過最初預期”。

隨著OpenAI核心技術不再開源，且與微軟的關系越來越密切時，馬斯克的不滿可想而知。馬斯克在起訴書中批評稱：“OpenAI已經變成全球最大技術公司微軟事實上的閉源子公司。在其新董事會的領導下，OpenAI不僅在開發，而且實際上正在完善一種AGI，以最大化微軟的利潤，而不是造福人類。”

背後是開源閉源路線之爭

在雙方的爭端中，一個值得關註的點是，馬斯克要求OpenAI恢復開源。這折射出的也是AI浪潮下的一個爭議性話題——到底應該開源還是閉源？

在開源閉源之爭上，馬斯克堅定地選擇前者。

《每日經濟新聞》記者註意到，馬斯克旗下特斯拉的核心技術就已經在全球范圍內開源。根據新加坡咨詢公司GreyB的統計，截至2023年末，全球范圍內特斯拉共擁有專利3304項（不包含審批中專利），其中有2397項仍然有效。據媒體統計，刨除重復的情況，特斯拉共有222項開放專利。從技術類別上看，特斯拉開放的專利屬於比較核心的專利。

圖片來源：GreyB網站

馬斯克旗下另一傢公司SpaceX也曾公開猛禽發動機圖紙。在去年12月接受外媒采訪時，馬斯克曾透露，“SpaceX不使用（獨占）專利，完全開放。”

而將視角放大到整個科技界，開源還是閉源也是一直爭論不休的話題。2023年10月31日，“開源派”曾簽署一份呼籲AI研發更加開放的聯名信，截至發稿，1821名專傢都簽下名字。

圖片來源：mozilla官網

“開源對於防止權力集中很重要，我們不希望未來隻有少數財力雄厚的科技公司才能控制前沿模型。” 紐約大學坦登工程學院計算機科學與工程系副教授Julian Togelius在接受《每日經濟新聞》記者采訪時表示。“到目前為止，每個大型模型都在某種程度上是‘可越獄的’。（開源讓）我們解其弱點，才能知道如何更好地部署模型。”（註：“越獄”指的是通過提示註入技術修改模型的行為。）

馬薩諸塞大學洛厄爾分校計算機科學教授Jie Wang也對每經記者稱，“開源代碼可以提高透明度並有助於推進技術，世界各地的相關方可以幫助識別開發團隊未能發現的代碼中的潛在陷阱，並提供更正。這有助於降低代碼可能執行有害操作的風險。”不過，他也指出，開源並不是解決所有安全問題的靈丹妙藥。

而反對開源的一派認為，開源AI會被不良行為者操縱。去年10月20日，來自麻省理工學院和劍橋大學的科學傢們發表一篇論文，他們通過實驗研究持續模型權重的擴散是否會幫助惡意者利用更強大的未來模型來造成大規模傷害，結果發現，開源大模型的確可能存在風險。

Jie Wang對記者表示，“不同的態度取決於不同的身份。學術研究人員希望AI技術是開源的，以便可以評估和修改代碼。另一方面，企業傢可能為保護投資和業務，而不願意開放源代碼。”

科技巨頭與AI新貴在開源或閉源的問題上也采取不同的路線。前者最近在互聯網上免費提供其生成式AI的代碼，例如，目前開源大模型被Meta的Llama主導，許多開源模型都是基於Llama而開發；後者如OpenAI和Anthropic則出售專有AI模型的API訪問權限，但不共享代碼。

OpenAI和Anthropic高管認為，政府應該監管最強大的AI模型，這樣壞人就不能輕易利用它們。今年1月，Anthropic 公司研究人員還發表論文警告稱，AI中毒可能導致開源大模型變成潛伏的間諜。

圖片來源:arxiv.org
圖片來源：arxiv.org

但在去年9月的美國參議院人工智能洞察論壇上，Meta首席執行官馬克·紮克伯格等人卻認為，開源模式對美國保持競爭力至關重要，科技行業可以解決對開源模式安全的擔憂。

若實現AGI，是否需要開源？

“開源是大勢所趨，我認為Meta正在引領這一趨勢，其次是Mistral AI、HuggingFace等規模較小的公司。” Julian Togelius告訴《每日經濟新聞》記者。

盡管Mistral AI最初推出開源模型，隨著規模的擴大，其作風似乎越來越像OpenAI靠近，采取閉源路線。對此，Togelius表示，“他們需要以某種方式賺錢，但目前還不清楚如何在這個領域最好地賺錢，但Mistral AI比 OpenAI 幾乎不開源的情況要好得多。”

而大型科技巨頭Google近日的動作似乎也是對Togelius言論的驗證。今年2月，Google罕見地改變去年堅持的大模型閉源策略，推出“開源”大模型Gemma。有報道認為，Gemma代表Google大模型策略的轉變——兼顧開源和閉源，開源主打性能最強大的小規模模型，希望戰勝Meta和Mistral AI；閉源則主打規模大的效果最好的大模型，希望盡快追上OpenAI。

去年5月，一份Google的內部文件曾在網上激起千層浪。文件認為，開源大模型迅猛發展，正在侵蝕OpenAI和Google的陣地。除非改變閉源的立場，否則開源替代品將最終使這兩傢公司黯然失色。“雖然我們的模型在質量方面仍略占優勢，但（閉源和開源模型）的差距正在以驚人的速度縮小。”文件寫道。

“這（指的是Google的新舉措）對研究和開發人員來說的確是個好消息。”Jie Wang對每經記者說道。“不過我懷疑Google是否會將一切開源。我認為未來各個主要參與者都會將其大模型的某些部分開源，以便研究人員和開發人員解模型的架構和訓練過程，但從業務角度來看絕對不是最重要的部分，例如用於訓練其 LLM 和預訓練模型權重的完整數據集。這或多或少類似於Meta開源LLaMA的方式。”

而在對OpenAI的起訴書中，馬斯克還提到對AGI（通用人工智能）的擔憂。當被問及若達到AGI，是否需要開源時，Julian Togelius表示，“我不認為AGI是一個定義特別明確或有用的概念。如果你 5 年前向某人展示 Claude 3 或 GPT-4，他們可能會認為我們已經實現 AGI。盡管如此，還有很多事情是大模型無法做到的。”

Togelius認為，OpenAI可能最終不會選擇開源，“因為這將決定性地改變我們對風險計算的看法，並最終消除人們認為OpenAI具有某種秘密武器的傾向（事實並非如此，Google 和 Anthropic 都擁有相似強度的模型）。”

Jie Wang也向記者表示，“除非有一個可執行的國際法要求所有AI技術必須開源，而如何強制執行是另一個具有挑戰性的問題，我對OpenAI 是否會開源一切持懷疑態度。”

馬斯克、OpenAI決裂背後，大模型應該開源還是閉源？

相關推薦

大模型開不開源，矽谷大佬激辯：一方談科學進步另一方提國傢安全

大模型應開源還是閉源？周鴻禕懟上李彥宏

馬斯克起訴OpenAI十八日後 Grok開源

馬斯克大戰OpenAI：“開源”之爭，敲響人工智能安全警鐘？

Google加入開源戰局低配版Gemma相當於OpenAI把GPT-3開源

馬斯克稱OpenAI未達到他的預期：閉源且逐利由微軟實際掌控

OpenAI核心資料被盜 Google承認“主動攻擊” 成本僅150元？

馬斯克踢館ChatGPT背後：“X帝國”整合進行時

誰在“吊打”ChatGPT？

馬斯克46頁訴狀狀告OpenAI稱自己被騙慘要求賠錢、開源

微軟註資“歐洲版OpenAI” 馬斯克辣評：所以他們閉源？

OpenAI AGI時間表疑似泄露神秘模型Q*細節曝光 GPT-5或推遲發佈

馬斯克為何要作開源“秀”?

李彥宏首次回應為何不開源文心大模型：閉源能賺到錢才能聚集人才