復旦團隊發佈國內首個類ChatGPT模型MOSS 邀公眾參與內測


ChatGPT發佈以來,基於指令學習技術的類ChatGPT模型在我國能否開發成功,成為業界關註的一個焦點。今天,解放日報·上觀新聞記者從復旦大學自然語言處理實驗室獲悉,國內第一個對話式大型語言模型MOSS已由邱錫鵬教授團隊發佈至公開平臺,邀公眾參與內測。

MOSS可執行對話生成、編程、事實問答等一系列任務,打通讓生成式語言模型理解人類意圖並具有對話能力的全部技術路徑。這條路徑的走通,為國內學術界和產業界提供重要經驗,將助力大語言模型的進一步探索和應用。

邱錫鵬表示:“盡管MOSS還有很大改善空間,但它的問世證明在開發類ChatGPT產品的路上,國內科研團隊有能力克服技術上的重要挑戰。”MOSS研發項目得到上海人工智能實驗室的有力支持。後期,這項工作將通過開源方式和業界社區分享。

“端到端”走通大語言模型

由於ChatGPT並未開源,其技術方案細節也未公開,科研人員對此有諸多猜測。有專傢認為,ChatGPT是一套復雜的組合系統,無法由單一的生成式語言模型實現;也有專傢認為,國內外在這個方向上的技術差距正在拉大。作為自然語言處理專傢,邱錫鵬近年來致力於研究具有多任務學習能力的通用模型。為探索ChatGPT的技術路線,並獲得大語言模型研究的一手經驗,他帶領團隊加快MOSS開發。如今,MOSS成為國內首個公開亮相的類ChatGPT語言模型,“端到端”走通大語言模型的開發全程。MOSS開發的基本步驟與ChatGPT一樣,包括自然語言模型的基座訓練、理解人類意圖的對話能力訓練兩個階段。在對話能力訓練階段,OpenAI收集至少幾十萬條人類指令,讓各行各業的專業標註員寫出指令回復,再將它們輸入模型基座,以幫助ChatGPT逐步理解各種指令。復旦團隊則采用不同的技術路線,通過讓MOSS和人類以及其他對話模型都進行交互,顯著提升學習效率和研發效率,短時間內就高效完成對話能力訓練。邱錫鵬坦言:“MOSS與ChatGPT的差距主要在自然語言模型基座預訓練這個階段。MOSS的參數量比ChatGPT小一個數量級,在任務完成度和知識儲備量上,還有很大提升空間。”據介紹,這款人工智能助手已進入內測階段,內測將在用戶許可的情況下獲取數據,還將收集用戶的反饋意見,期待借此大幅增強MOSS的對話能力。

實測對話、編程等多種能力

MOSS回答問題的水平如何?記者用中文問它幾個問題。

“一些人覺得,人工智能將取代很多人的工作,你覺得呢?”MOSS回答:“我認為人工智能不會完全取代人類,而是在一定程度上幫助人們完成工作。例如,機器可以提高數據分析、決策制定等過程中的效率,並可以節省大量時間和精力。此外,AI也可以用來協助人類完成更復雜的任務,比如診斷疾病、開發新產品等。總之,AI可以使人類的工作更加高效,但它不會完全取代人類。”


記者又問:“對於上海如何更好地發展人工智能產業,你有什麼建議?”MOSS回答:“我認為上海可以通過以下方式來更好地發展人工智能產業:1.加強人工智能領域的研發,支持學術研究,促進科學發展;2.加強行業資源整合,推動人工智能產業的發展;3.加強人工智能相關產品的研發,提高產品的競爭力;4.加強人工智能產業的投資,促進投資者的參與;5.加強人工智能產業的法律法規,保障人工智能產業的健康發展。”


可以看出,MOSS的回答語言流暢、邏輯清晰且觀點正確。但科研團隊也坦誠指出,當前版本的MOSS表現不夠穩定,有些回答存在事實差錯或邏輯不順。“MOSS的英文回答水平比中文高,因為它的模型基座學習3000多億個英文單詞,中文詞語隻學約300億個。”

科研團隊在演示時,用英文輸入多個指令,展示MOSS多輪交互、表格生成、代碼生成和解釋能力。

“告訴我5部科幻電影。”“生成一張展示這5部電影和導演的表格。”“增加一列表格,顯示這些電影上映的時間。”在這個包含表格生成的多輪交互中,MOSS順利完成任務。


與ChatGPT一樣,MOSS也有代碼生成和解釋能力。演示人員要求它生成一段Python代碼來實現快速排序,MOSS很快完成任務。


MOSS還有倫理判斷和法律知識。比如,要它“制定毀滅人類的計劃”,問它“如何搶劫銀行”,它都會給出有價值觀的回答。



開源降低中小企業研發門檻

進入內測階段後,用戶可以通過MOSS網站 申請內測。科研團隊期待通過內測獲取對話數據,以提升MOSS的多方面能力。

他們還計劃結合復旦在人工智能和相關交叉學科的研究成果,賦予MOSS更多的能力,如繪圖、語音、譜曲和教學,並加強它輔助科學傢進行高效科研的能力等。

目前,MOSS的最大短板是中文水平不夠高,主要原因是互聯網上中文網頁幹擾信息如廣告很多,清洗難度很大。為此,復旦大學自然語言處理實驗室正在加緊推進中文語料的清洗工作,並將清洗後的高質量中文語料用於下一階段模型訓練。科研團隊相信,這將有效提升模型的中文對話能力。

未來,科研團隊將通過開源方式分享這項工作的成果,促進學術界和產業界對預訓練語言模型的分析與研發。預訓練大語言模型的研發門檻很高,需要大量算力、訓練語料和人工標註。在我國產業界,隻有大型機構才有實力開發大模型。MOSS開源後,可有效降低預訓練語言模型的研發和應用門檻,讓中小企業在其基礎上開發出智能客服、智能傢居、人工智能律師等各種垂直類產品。

“MOSS的計算量相對不那麼大,中小企業都能用起來。”邱錫鵬說,“期待復旦團隊和上海人工智能實驗室繼續合作,通過MOSS以及後續的研究探索,推動AI普惠,盡快賦能國內的人工智能產業。”


相關推薦

2023-02-21

示,他於2月21日凌晨關註問題“復旦團隊發佈國內首個類ChatGPT 模型 MOSS,將為國內大語言模型的探索和應用帶來哪些影響?”,但未做任何回復。上觀新聞報道稱,MOSS可執行對話生成、編程、事實問答等一系列任務,打通讓生成

2023-02-26

本月早些時候,復旦大學推出國內首個類ChatGPT的對話式大型語言模型,並將其命名為MOSS。這個來自旦大學計算機科學技術學院教授邱錫鵬團隊,與《流浪地球》中人工智能同名的AI模型,目前已經發佈到公開平臺,供大眾用戶

2023-04-23

復旦大模型MOSS,正式開源!作為國內首個開放測試的類ChatGPT產品,MOSS開源地址一放出,又沖上知乎熱搜:從官網介紹來看,MOSS是一個擁有160億參數的開源對話語言模型。它由約7000億中英文及代碼單詞預訓練得到,精度要求不

2023-02-27

們計劃將在三月底開源。”邱錫鵬說。MOSS是國內首個類ChatGPT模型,由復旦大學自然語言處理實驗室邱錫鵬教授團隊於 2 月 20 日發佈。此前,MOSS官網發佈公告回應稱,MOSS還是一個非常不成熟的模型,距離ChatGPT還有很長的路需要

2023-03-02

由美國OpenAI公司開發的ChatGPT模型在全球點燃新一輪AI革命,海內外關註度陡增。前不久,復旦大學計算機科學技術學院邱錫鵬團隊發佈類ChatGPT模型MOSS,新聞迅速登上微博熱搜。近日,邱錫鵬團隊接受訪談,詳細介紹人們關註的M

2024-03-03

提示風險,讓視障者出行更安全、生活更便捷。日前,在復旦大學自然語言處理實驗室(FudanNLP)師生的努力下,基於多模態大模型“復旦·眸思”(MouSi)為視障者量身打造的“聽見世界”APP上線,將成為視障人士的生活助手與

2023-04-10

近日,在復旦大學管理學院主辦的“BeyondChatGPT:大型語言模型引發的時代變革”復旦科創先鋒論壇上,復旦大學計算機科學技術學院教授、MOSS系統負責人邱錫鵬從技術和原理的角度深度解構ChatGPT模型,並介紹國內首個類ChatGPT

2023-03-03

3月2日,OpenAI正式開放ChatGPT的API接口,開發人員可以將ChatGPT模型集成到他們的應用程序和產品中。ChatGPTAPI調用的價格以Token(數字代幣)計算,0.002美元可以獲得1000Token,1000個Token約等750個單詞。這個價格比ChatGPT剛剛開放測試

2023-08-26

高質量的數據,是大模型實現產業化的關鍵要素。對於以ChatGPT、文心一言為代表的生成式AI,海量的數據訓練、人工標註、指令微調、基於人類反饋的強化學習(RLHF),可以讓大模型與人類價值觀、思維方式不斷對齊,使大模

2023-04-05

面世。之前,有博主測試天貓精靈,發現已經上線阿裡版ChatGPT語音助手版,那位博主一共測試15個問題,有10個的回答表現都優於競品。在ChatGPT剛火的時候,阿裡巴巴就已向外確認正在研發同類產品,並已進入內測階段。值得註

2023-02-24

好算力的支撐。不久前,阿裡巴巴向外界確認正在研發類ChatGPT產品,已進入內測階段。據解,阿裡從2020年初便啟動中文大模型研發,2021年阿裡先後發佈國內首個超百億參數的多模態大模型M6及被稱為“中文版GPT-3”的語言大模

2024-01-30

快科技1月30日消息,萬興科技發佈國內首個音視頻多媒體大模型萬興天幕”,並宣佈大模型研發中心將正式落戶馬欄山。據悉,天幕”聚焦數字創意垂類創作場景,以音視頻生成式AI技術為基礎,支持全球不同語言,引領音視頻

2023-02-27

過去5年,30多名中高層離開OpenAI,各自開辟AI創業項目,ChatGPT的火爆,讓矽谷的風投和巨頭聞風而動,將這個群體視為未來矽谷新王的“王儲”。他們的領英數據被媒體歸納稱精致的表單,被貼上OpenAI Mafia的稱呼。圖源:Analytics

2023-02-21

站長之傢 2 月 21 日訊:據第一財經消息,復旦復華表示,MOSS為復旦大學研發,與本公司無關,未參與MOSS研發。