11月16日,原阿裡首席AI科學傢賈揚清吐槽國內某一新模型中用的其實是LLaMA架構,僅在代碼中更改幾個變量名引發網絡熱議。在被指大模型回應並發佈訓練模型過程後,賈揚清最新發文談為什麼開源領域“魔改”要不得。
賈揚清指出,開源是一個相互合作的事情,本質是要大傢能夠求同尊異,討論設計,磨合觀點,最後擰成一股繩往前走。初入開源以及better engineering的人往往有一種傾向,“這代碼我拿來,魔改下,然後我自己自定義也靈活,何樂而不為?”但是就社區而言這種事情絕對弊大於利,最後形成各種分裂的技術體系,沒法維護,沒法協作,對於創作者和使用者都是非常大的問題。
他還表示,魔改一時爽,社區火葬場,要真的做出成就來,就得真的有能夠和社區一起玩的心。
11月14日,“零一萬物”公司正式公開回應此事,該公司開源團隊總監Richard Lin承認修改Llama張量名稱的做法不妥,將會按照外界建議把“修改後的張量名稱從Yi改回LLaMA”。
11月15日,零一萬物正式公開對Yi-34B訓練過程的說明。李開復也在朋友圈轉發該說明,並表示:“零一萬物Yi-34B模型訓練的說明也回應這兩天大傢對於模型架構的探討。全球大模型架構一路從GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行業逐漸形成大模型的通用標準(就像做一個手機app開發者不會去自創iOS、Android以外的全新基礎架構)。01.AI起步受益於開源,也貢獻開源,從社區中虛心學習,我們會持續進步。”