零一萬物回應大模型架構爭議:對模型和訓練的理解做大量工作


李開復旗下AI企業零一萬物開源大模型被指責完全使用LLaMA的架構,隻對兩個張量(Tensor)名稱進行修改。對此,零一萬物表示:GPT是一個業內公認的成熟架構,Llama在GPT上做總結。

零一萬物研發大模型的結構設計基於GPT成熟結構,借鑒行業頂尖水平的公開成果,由於大模型技術發展還在非常初期,與行業主流保持一致的結構,更有利於整體的適配與未來的迭代。同時零一萬物團隊對模型和訓練的理解做大量工作,也在持續探索模型結構層面本質上的突破。


相關推薦

2023-11-15

工場CMO發朋友圈回應Yi大模型“抄襲LLaMA”事件,她表示零一萬物發佈Yi-34B模型訓練的說明,回應對於模型架構的探討輿論。創新工場CMO發文表示,沿用行業演進漸成通用、生態擁抱的基礎架構就成“套模、山寨“?(就像手機app開

2023-11-16

針對近日零一萬物被質疑完全使用LLaMA架構,隻對兩個張量(Tensor)名稱做修改一事,李開復在朋友圈再度發文回應稱:“全球大模型架構一路從 GPT2 --> Gopher --> Chinchilla --> Llama2 --> Yi,行業逐漸形成大模型的通用標準,

2024-02-22

統能力的排行榜榜首。它就是知名風投人士李開復創立的零一萬物(01.AI)。當時,零一萬物剛剛成立8個月時間,但擁有財力雄厚的投資者,已經是估值達到10億美元的“獨角獸”。李開復在接受采訪時將他的AI系統描繪成其他大模

2023-11-16

就來,就得真的有能夠和社區一起玩的心。11月14日,“零一萬物”公司正式公開回應此事,該公司開源團隊總監Richard Lin承認修改Llama張量名稱的做法不妥,將會按照外界建議把“修改後的張量名稱從Yi改回LLaMA”。11月15日,零

2023-11-06

業-一個偉大的抱負。3月底,李開復成立一傢名為01.AI(零一萬物)的公司,旨在為中國市場開發本土化的大型語言模型。這次創業使他與包括搜狗創始人王小川在內的其他著名中國科技領袖展開競爭,後者正在迅速聚集人才和

2023-11-14

,創新工場董事長兼CEO李開復創辦的AI大模型創業公司“零一萬物”推出Yi-34B和Yi-6B兩個開源大模型,並聲稱對學術研究完全開放,同步開放免費商用申請。然而,在Yi-34B的HuggingFace開源主頁上,開發者ehartford質疑該模型使用MetaLL

2023-11-07

11月6日晚間消息,李開復帶隊創辦的AI2.0公司零一萬物今日宣佈開源發佈首款預訓練大模型Yi-34B。零一萬物創始人及CEO李開復表示:“零一萬物堅定進軍全球第一梯隊目標,從招的第一個人,寫的第一行代碼,設計的第一個模型

2024-06-15

6月15日消息,在第六屆“北京智源大會”上,零一萬物CEO、創新工場董事長李開復博士,中國工程院院士、清華大學智能產業研究院(AIR)院長張亞勤院士、智源研究院理事長黃鐵軍教授,三位行業領袖就大模型的成功因素、面

2024-03-14

3月14日消息,零一萬物正式發佈Yi大模型API開放平臺,今天起為開發者提供通用Chat“Yi-34B-Chat-0205”、200k超長上下文“Yi-34B-Chat-200K”、多模態交互“Yi-VL-Plus”模型。在全球多項權威評測榜單中,Yi 大模型表現優異,性能直追 GPT-

2024-05-08

李開復帶隊籌建的零一萬物官宣發佈一款一站式AI工作平臺——萬知。它可以做會議紀要、周報、寫作助手,還可以解讀財報、論文等各類文件,幫你做PPT,支持中英雙語,完全免費。目前,大眾可以通過網頁和微信小程序萬知A

2024-05-10

公司Meta的Llama大模型。2023年11月,李開復旗下AI創業公司零一萬物就曾引發重大爭議,原因是一些AI工程師發現,零一萬物的AI模型Yi-34B是基於Meta的Llama大模型開發的。在這項新法案宣佈前,微軟公司還宣佈向阿聯酋AI公司G42投資1

2024-05-06

回答這些問題的途徑。該架構的核心是一個可預測的世界模型,它允許系統預測其行動的後果,並規劃一系列行動來優化一組目標。目標包括保證系統可控性和安全性的護欄。世界模型采用經過自監督學習訓練的分層聯合嵌入預

2024-01-30

的式說大模型、銜遠科技的品商大模型和摹小仙大模型、零一萬物的零一萬物大模型、識因智能的一葉輕舟大模型、小米的小愛同學AI助手功能;智聯招聘的AI改簡歷功能、脈脈的智能問答功能、BOSS直聘的南北閣大模型、什麼值

2023-04-01

以點擊文章最後的視頻號卡片觀看。ChatGPT這樣的大語言模型,理解的語言到底是什麼?要解釋這個問題,或許就需要知道ChatGPT到底是怎麼“說話”的。這可以從GPT三個字母的全稱,Generative Pre-trained Transfomer(生成型預訓練變換