AI大模型使用美國開源技術?李開復回應


北京時間2月22日,去年11月,就在ChatGPT震撼發佈一年後,一傢相對不知名的中國創業公司躍居到一項評估開源人工智能系統能力的排行榜榜首。它就是知名風投人士李開復創立的零一萬物(01.AI)。

當時,零一萬物剛剛成立8個月時間,但擁有財力雄厚的投資者,已經是估值達到10億美元的“獨角獸”。李開復在接受采訪時將他的AI系統描繪成其他大模型的替代品,比如Facebook母公司Meta的開源生成式AI模型LLaMA。

不過,零一萬物那時發佈的開源大語言模型Yi-34B采用的部分技術基於LLaMA架構,該公司以Meta的技術為基礎,然後使用新數據訓練其系統,使其變得更強大。這個事情還曾引起爭議。據國內媒體報道,零一研發團隊當時回應稱,將對大語言模型重命名,從Yi改回LLaMA,公司也將發佈改名後的新版本。

對此,李開復在最新郵件聲明中回應稱,就像“大多數其他AI公司一樣”,零一萬物的AI模型建立在LLaMA基礎之上,使用開源技術是行業的一種標準做法。他指出,零一萬物使用自己的數據和算法,從頭開始訓練其AI模型,這些才是其大模型“優越性能”的“主要決定因素”。

Meta在回應時引用公司全球事務主管尼克·克萊格(Nick Clegg)的評論。克萊格曾表示,公開分享該公司的AI模型有助於傳播其價值觀和標準,進而有助於確保美國的領導地位。

ChatGPT的橫空出世引發一波生成式AI熱潮。中國企業也在積極開發生成式AI,但是依賴於美國的底層系統。據十幾位科技界內部人士和頂尖工程師表示,中國目前在生成式AI方面落後美國至少一年,而且可能還會進一步落後。


相關推薦

2023-11-16

做修改一事,李開復在朋友圈再度發文回應稱:“全球大模型架構一路從 GPT2 --> Gopher --> Chinchilla --> Llama2 --> Yi,行業逐漸形成大模型的通用標準,就像做一個手機app開發者,不會去自創 iOS、Android 以外的全新基礎架構

2023-11-06

一萬物)的公司,旨在為中國市場開發本土化的大型語言模型。這次創業使他與包括搜狗創始人王小川在內的其他著名中國科技領袖展開競爭,後者正在迅速聚集人才和風險資本,以建立中國的OpenAI。李開復在接受采訪時解釋創

2023-11-14

近日,創新工場董事長兼CEO李開復創辦的AI大模型創業公司“零一萬物”推出Yi-34B和Yi-6B兩個開源大模型,並聲稱對學術研究完全開放,同步開放免費商用申請。然而,在Yi-34B的HuggingFace開源主頁上,開發者ehartford質疑該模型使用

2024-04-01

的起步相對較晚。然而,如今中國正積極利用開源大語言模型,努力縮小與美國的差距。以下為部分內容翻譯:英偉達在股市上的亮眼表現,突顯芯片質量及其可用性在決定人工智能時代勝者的關鍵作用。然而,想要全面評估這

2023-11-07

創辦的AI2.0公司零一萬物今日宣佈開源發佈首款預訓練大模型Yi-34B。零一萬物創始人及CEO李開復表示:“零一萬物堅定進軍全球第一梯隊目標,從招的第一個人,寫的第一行代碼,設計的第一個模型開始,就一直抱著成為‘World

2023-11-12

清楚。但毫無疑問的是,隨著一傢技術公司開發出更大的模型,他們需要更多的計算 GPU 來訓練它們,甚至還需要更多的 GPU 來使用它們。也許曾在蘋果、微軟和Google工作過的李開復的意思是,公司有一個更大型模型和 GPU 需求的

2024-06-15

院士、智源研究院理事長黃鐵軍教授,三位行業領袖就大模型的成功因素、面臨的挑戰、產業化場景等多個熱點話題展開深入的討論。以下為討論內容部分摘錄:一、什麼原因使得大模型如此成功?黃鐵軍:近期關於大模型的討

2024-05-10

佈一項法案,該法案將使拜登政府更容易對人工智能(AI)模型實施出口管制,以保護這項重要美國技術不受外國不良行為者的侵害。該法案由眾議院共和黨議員邁克爾·麥考爾(MichaelMcCaul)、約翰·莫倫納爾(JohnMolenaar)、馬克斯·懷斯

2023-11-16

11月16日,原阿裡首席AI科學傢賈揚清吐槽國內某一新模型中用的其實是LLaMA架構,僅在代碼中更改幾個變量名引發網絡熱議。在被指大模型回應並發佈訓練模型過程後,賈揚清最新發文談為什麼開源領域“魔改”要不得。賈揚清

2023-03-20

力陸續到位,新公司期權由新團隊絕對主導,首批廣招大模型、多模態、NLP、AI算法工程與研究、分佈式計算/Infrastructure 等方向的頂級人才推薦自薦。”據官網資料,李開復於2009年創立創新工場。在此之前,李開復曾是Google全

2023-11-14

李開復旗下AI企業零一萬物開源大模型被指責完全使用LLaMA的架構,隻對兩個張量(Tensor)名稱進行修改。對此,零一萬物表示:GPT是一個業內公認的成熟架構,Llama在GPT上做總結。零一萬物研發大模型的結構設計基於GPT成熟結構

2024-05-08

以表格的形式呈現,方便用戶直接上手。同時,為彌補大模型知識庫的滯後性、避免幻覺產生,萬知支持實時訪問和整合互聯網信息,為用戶提供最新的數據和見解。此外,萬知還可在10秒內完成數十萬字超長文檔閱讀。(文猛

2024-05-26

在2017年,李開復就曾預言,AI的影響力將超過歷史上所有技術革命的總和,包括電力和互聯網,並可能在未來10年內取代50%的人類工作。如今距離他預測的時間線隻有三年,當被問及這一預測是否還成立,李開復回答說:實際上

2023-11-16

"幾代"內繼續開發其生成式人工智能模型。劉熾平說:"我們所做的關鍵事情之一就是率先訂購H800,這讓我們擁有相當不錯的庫存。"他補充說,騰訊目前正在中國尋找新的供應商,"采購這些訓練芯