原阿裡首席AI科學傢賈揚清再發聲:開源領域“魔改”要不得


11月16日,原阿裡首席AI科學傢賈揚清吐槽國內某一新模型中用的其實是LLaMA架構,僅在代碼中更改幾個變量名引發網絡熱議。在被指大模型回應並發佈訓練模型過程後,賈揚清最新發文談為什麼開源領域“魔改”要不得。

641.webp

賈揚清指出,開源是一個相互合作的事情,本質是要大傢能夠求同尊異,討論設計,磨合觀點,最後擰成一股繩往前走。初入開源以及better engineering的人往往有一種傾向,“這代碼我拿來,魔改下,然後我自己自定義也靈活,何樂而不為?”但是就社區而言這種事情絕對弊大於利,最後形成各種分裂的技術體系,沒法維護,沒法協作,對於創作者和使用者都是非常大的問題。

他還表示,魔改一時爽,社區火葬場,要真的做出成就來,就得真的有能夠和社區一起玩的心。

11月14日,“零一萬物”公司正式公開回應此事,該公司開源團隊總監Richard Lin承認修改Llama張量名稱的做法不妥,將會按照外界建議把“修改後的張量名稱從Yi改回LLaMA”。

11月15日,零一萬物正式公開對Yi-34B訓練過程的說明。李開復也在朋友圈轉發該說明,並表示:“零一萬物Yi-34B模型訓練的說明也回應這兩天大傢對於模型架構的探討。全球大模型架構一路從GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行業逐漸形成大模型的通用標準(就像做一個手機app開發者不會去自創iOS、Android以外的全新基礎架構)。01.AI起步受益於開源,也貢獻開源,從社區中虛心學習,我們會持續進步。”


相關推薦

2023-11-14

慮將這一更改應用到官方模型中。此外,網上流傳著一張原阿裡首席AI科學傢賈揚清的朋友圈,內容稱“某國內大廠新模型正好就是LLaMA架構,但為表示不一樣,把代碼裡面的名改成他們的名字,然後換幾個變量名”。值得一提

2024-02-21

、遠低於GPU的token成本,這顆AI芯片最近討論度暴漲。連原阿裡副總裁賈揚清都公開算賬,分析LPU和H100跑大模型的采購和運營成本到底差多少。就在Groq風風火火之際,全球最大AI芯片公司英偉達陷入一些振蕩。今日英偉達官宣將

2023-11-28

不是動輒就把別人底層的代碼拿過來包裝自己的,這是最要不得的。如果我們一直浮在上面,一直去拿別人的東西,那麼我科技大廈的地基永遠是脆弱的,難以支撐起整個AI科技樹的成長。”沈萌表示。在沈萌看來,AI之所以能

2023-11-16

獻開源,從社區中虛心學習,我們會持續進步。此前,前阿裡巴巴副總裁、知名AI框架技術人賈揚清發朋友圈感慨做小公司不容易,希望國內企業如果就是開源的模型結構,不要做換名偽裝,免得小公司做一些多餘的適配工作。

2023-03-03

GPT的Bard。在這方面,中國並不落後。2023年2月起,百度、阿裡、騰訊、京東、字節等紛紛發聲表示自己在大模型領域已經開展深入研究,且獲得很多成果。一時間,追逐大模型成國內AI行業的標準動作,“大練模型到煉大模型”

2024-02-04

端對端加密技術,以及生成式AI模型。Javier Olivan,47歲,首席運營官Olivan在Meta工作14年,歷任首席增長官和中心產品副總裁等職位,2022年晉升為首席運營官,接替知名技術高管Sheryl Sandberg。Chris Cox,41歲,首席產品官Cox在2005年以

2024-04-18

興看到 Perplexity 成為未來融資動作的標桿,包括前 Meta 和阿裡巴巴高管都來取經!Perplexity 的影響力已經不局限於產品本身,而是輻射到整個科技生態和行業發展,令人振奮!”雙方粉絲當時也各執一詞。支持Perplexity的人認為Lep

2024-03-18

拉吞並OpenAI?自去年OpenAI的“宮鬥大戲”中銷聲匿跡的前首席科學傢蘇茨克維(Ilya Sutskever),在此次事件中又扮演怎樣的角色?未來的GPT-4乃至AI,究竟要走向開源還是閉源?起訴與回擊:真相如何?2015年12月,馬斯克與奧特曼

2023-11-28

近日,阿裡達摩院量子實驗室官方確認裁撤,實驗室連帶儀器設備全部被捐給浙江大學一事引發熱議。今日,達摩院量子實驗室主要負責人、阿裡雲量子技術首席科學傢施堯耘發佈疑似達摩院量子實驗室全體成員在阿裡巴巴的“

2023-11-19

已建立起一套完全和中國大客戶精準耦合的組織體系。有原阿裡雲銷售稱,自己和同事招投標時,華為雲來二三十人,把客戶全流程進行梳理。但反觀阿裡雲,僅有三個人,最終中標方自然是華為雲。遇到華為雲必敗,更是成為

2024-03-08

艾倫人工智能研究所(Allen Institute for AI)的首席執行官阿裡·法哈迪(Ali Farhadi)表示:“我們現在正處在一個關鍵節點,大規模部署一項我們尚未完全理解的技術,也不知道如何有效控制這些系統。”該研究所由已故微軟聯合

2024-02-22

行性。芯片上沒有分支目標緩沖區或緩存代理,”Groq 的首席架構師 Dennis Abts 解釋道。Groq LPU芯片為追求性能最大化,因此添加更多SRAM內存和執行塊。SRAM全名為“靜態隨機存取存儲器”(Static Random-Access Memory)是隨機存取存儲

2023-09-09

& Data 基金會,這對構建大模型至關重要。華為,ZTE,阿裡、CSDN 的加入使這些模型更加可靠。另外,LF AI & Data 最近成立 Generative AI 工作組,專職開源大模型方面的項目,預計9月在深圳發佈。鄒欣:IT 領域已經在歷史上證明

2024-02-25

比如智譜AI的創始人張鵬、百川智能的創始人王小川、從阿裡畢業後投身Infra的賈揚清,以及剛剛獲得中國最大一筆融資的月之暗面楊植麟,無一不出自於清華。他們代表的,是清華的四代創業者。其中我們最熟悉的,一定是王