斯坦福大學的一個AI團隊在 5 月 29 日發佈一個名為Llama3-V的多模態大模型,並宣稱隻需 500 美元就能訓練出一個性能與GPT4-V相媲美的模型。然而,該模型隨後被指控抄襲,與國內由面壁智能和清華大學自然語言處理實驗室聯合推出的大模型MiniCPM-Llama3-V 2. 5 存在極高的相似度。
面壁智能的CEO李大海和聯合創始人劉知遠對此事件先後發表回應,認為盡管這在某種程度上可以看作是他們成果得到國際團隊的認可,但他們更希望建立一個開放、合作、有信任的社區環境。目前,斯坦福的團隊已經公開道歉,並刪除相關庫和官宣推文。
Llama3-V模型在社交媒體上迅速走紅,並一度登上HuggingFace趨勢榜首頁。但隨後,一名網友發現Llama3-V與MiniCPM-Llama3-V 2. 5 在結構、代碼、配置文件上幾乎一模一樣,僅有變量名被替換。網友在面壁智能GitHub的項目下展示一系列證據。
劉知遠教授在知乎上回應稱,MiniCPM-Llama3-V 2. 5 在研發時內置一個彩蛋,即對“清華簡”的識別能力,而Llama3-V模型也展現出一模一樣的能力。清華簡是清華大學收藏的一批戰國竹簡,為戰國中晚期文物。劉知遠透露,識別清華簡是MiniCPM-Llama3-V 2. 5 的一項實驗功能,訓練圖像是最近從出土文物中掃描並標註的,且尚未公開發佈。
遭到質疑後,斯坦福團隊成員刪除官宣模型的推文,並將項目在Github和HuggingFace上的庫一並刪除。團隊成員森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平臺上向面壁MiniCPM團隊正式道歉,並表示會將Llama3-V模型撤下。
李大海在聲明中表達對此事的深切遺憾,並強調應該構建一個開放、協作且充滿信任的技術社區環境。他們希望團隊的努力和優秀工作能夠吸引更多人的關註和認可,但並非以被模仿或抄襲的方式。
斯坦福人工智能實驗室主任克裡斯托弗·大衛·曼寧(Christopher David Manning)也發文譴責這一抄襲行為。
面壁智能首席科學傢劉知遠表示,人工智能的飛速發展離不開全球算法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續前進。開源共享的基石是對開源協議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞這一點。
面壁智能成立於 2022 年 8 月,由李大海擔任CEO,曾國洋為法定代表人,註冊資本約52. 46 萬人民幣。公司已完成兩輪融資,由知乎、智譜AI等投資。李大海畢業於北京大學數學系,曾任Google中國創始員工之一,後在知乎擔任合夥人、CTO。劉知遠是清華大學計算機系長聘副教授,智源青年科學傢,主要研究方向為自然語言處理、知識圖譜和社會計算。