復旦MOSS大模型開源 Github和Hugging Face同時上線

2023-04-23 來自量子位發表於業界精選

復旦大模型MOSS，正式開源！作為國內首個開放測試的類ChatGPT產品，MOSS開源地址一放出，又沖上知乎熱搜：從官網介紹來看，MOSS是一個擁有160億參數的開源對話語言模型。它由約7000億中英文及代碼單詞預訓練得到，精度要求不那麼高的話，甚至可以在單張3090顯卡上運行。

MOSS支持中英雙語，擁有多輪對話和使用多種插件雙重能力，具備搜索引擎、文生圖、計算器、方程求解的“技能點”。

目前，MOSS在GitHub上已有2.3k Star，熱度還在持續上漲中。

那麼，MOSS究竟開源哪些項目，目前有哪些功能？一起來看看。

會解方程，也能生成圖片

據解，這次MOSS開源的是第三輪迭代版本，名叫MOSS 003。

當然，MOSS 003也並非開源全部模型，目前主要開放的是基座預訓練模型，最終模型即將在近期開源：

此前，MOSS已經經歷兩版迭代，一版是公開邀請內測的MOSS 002版本，另一版是內部測試版本OpenChat 001。

三月份大夥兒見證的“國內首個開放測試的ChatGPT”，正是MOSS 002版本。

最新這個版本展現的功能效果如何？

MOSS團隊放出它多輪對話、解方程、寫代碼、生成圖片和回答道德倫理等示例。

這是多輪對話的展示效果，具備資料追根溯源的能力：

這是做數學題的示例，包括雞兔同籠問題：

也包括生成圖片功能：

還有近期網友熱議的AI道德性問題：

當然，這波裡面也不乏“砸場子”的網友。

例如官方GitHub問答中，有網友很想解它的中文能力和chatglm6b相比誰更好，下面有網友調侃：

你是來砸場子的麼？

這也是因為此前團隊在MOSS 002公開測試時曾經表示過，MOSS的中文能力不算太好，這也與訓練數據有關。

除此之外，團隊這次還開源一部分訓練數據。

至於完整數據，復旦MOSS團隊表示“近期會全部開源”。

國內最先發佈的ChatGPT產品

MOSS取自於《流浪地球》裡面那個擁有自我意識的AI。

它由復旦自然語言處理實驗室邱錫鵬團隊研發，2月20日正式發佈。

當時國內一眾大廠還在陸續高調官宣要造ChatGPT，誰都沒想到它就這麼一聲不吭地殺出來。

所以盡管MOSS的參數量比ChatGPT小一個量級，大傢還是蜂擁而上，把服務器都給擠爆。

而發佈沒過一周，復旦大學教授邱錫鵬就在演講中提出，如果優化順利，計劃在三月底開源MOSS。

因為在他看來：

人們之所以很容易有“卡脖子”問題，是因為缺乏一個好的行業生態。

就拿ChatGPT來說，OpenAI公司隻需專註做好模型，算力、數據和系統則交給其他公司。反觀國內，很多公司在做大型語言模型時所有環節都需要自己做，每傢的數據和算力也有限，結果是每傢都做不大。在發展過程中，大型語言模型訓練與在線推理成本過高也是一個重大問題。

因此，他們一開始就考慮要把MOSS開源而不是商業化。

有這樣一個基座，大傢就不用重復開發底層技術，可以在上面接不同的細分領域。

如今，雖晚快一個月，MOSS也說到做到。

你試用過復旦MOSS開源模型嗎？效果如何？

復旦MOSS大模型開源 Github和Hugging Face同時上線

相關推薦

一張估值20億的“笑臉” 正在拆掉OpenAI的圍墻

近300億，又一傢超級獨角獸誕生

號稱媲美GPT-3.5且免費 ChatGPT的替代品要拆掉OpenAI的圍墻

復旦類ChatGPT模型Moss或於三月底開源

復旦MOSS團隊回應服務器流量過載解釋名稱源於《流浪地球》

價值1億美元時 “AI作畫”背後的團隊開始互撕

復旦團隊發佈國內首個類ChatGPT模型MOSS 邀公眾參與內測

國內首個類ChatGPT模型：復旦大學團隊稱MOSS將於三月底開源

復旦MOSS大模型擬4月中旬開源邱錫鵬詳解如何構建

復旦MOSS團隊訪談：它就像一個“聰明的小孩”

老黃深夜炸場：AIGC進入iPhone時刻神秘顯卡勝過A100

復旦團隊研發大模型“眸思” 助力視障者“看見”世界

人工智能研究人員發現使用流行數據集的道德和法律風險

Google一月三大招硬剛OpenAI：開源最強大模型Gemini技術碾壓Llama 2