4月，國內大模型遍地開花

2023-04-16 來自鞭牛士公眾號發表於業界精選

ChatGPT的火熱掀起國內外對大模型的探索熱情，即便是一邊呼籲暫停AI研究以防“失控的人工智能”的馬斯克，近期也被曝正在推特內部啟動人工智能項目。

不管是差GPT“2個月”還是“3年”，國內大模型一夜之間已經遍地開花。繼百度打響國內大模型第一槍後，目前阿裡、京東、華為等互聯網大廠，商湯、昆侖萬維等科技公司也紛紛推出自傢的大模型，包括內容平臺知乎也在4月13日推出中文大模型“知海圖AI”。

另一邊，王小川、王慧文等互聯網大佬的大模型也有新進展。在獲得5000萬美元啟動資金後，4月10日，王小川官宣AI大模型公司“百川智能”;王慧文的 “光年之外”在A 輪融資後估值已達到10億美元。

接下來大模型的熱潮將繼續。雖然沒有直接推出大模型產品，但騰訊已經發佈“國內性能最強的大模型算力集群”，同花順、科大訊飛等正在跑步入場。

與此同時，有關大模型的討論也在繼續，我們需要這麼多大模型嗎?在這場大模型的同臺競技中，誰能最終脫穎而出，打造出中國的OpenAI?

百度“文心一言”大語言模型

被稱為中國版ChatGPT的百度“文心一言”於3月16日14:00在百度北京總部大樓正式發佈。百度在會上用PPT展示文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

百度同時公佈文心一言的邀請測試方案。發佈會後一小時內，排隊申請文心一言企業版API調用服務測試的企業用戶已達3萬多傢，申請產品測試網頁多次被擠爆。截至3月27日，百度文心一言已收到12萬傢企業申請測試。

從港股市場表現來看，發佈會當天，百度港股一度跳水跌超10%，百度當日股價最終跌近8%。但第二天，百度港股又大漲13.67%。

不過，作為國內第一款官宣的大模型，文心一言被追捧，也被質疑。

在發佈會結束大約一周後，文心一言深陷套皮質疑。

微博博主“劉大可先生”發文質疑文心一言文生圖功能抄襲“StableDiffusion”，同時在中文語義理解方面存在局限。他稱，找到對文心一言更多的不利證據，恐怕是和漢芯、鴻蒙一樣的東西:套殼、畫皮、造假。

3月23日，百度官博發文稱，註意到對文心一言文生圖功能的相關反饋，並針對質疑做出澄清。百度稱，文心一言完全是百度自研的大語言模型，在大模型訓練中，其使用的是互聯網公開數據，符合行業慣例。

3月27日，百度正式推出“文心千帆”大模型平臺。文心千帆大模型平臺，整合百度全套文心大模型、相應的開發工具鏈，未來還會支持第三方的開源大模型。在現場實時演示中，文心千帆可實現三分鐘做ppt、數字人直播帶貨、訂機票和酒店等操作。

4月3日，百度地圖V18版本發佈。該版本由文心交通大模型和生成式AI提供底層支撐，可面向實時交通實現刻畫、感知、預測、調度的端到端優化。一同發佈的還有領航數字人葉悠悠。介紹稱，葉悠悠可與車主實現擬人級語音交互。

阿裡雲“通義千問” 大語言模型

4月7日，在阿裡雲峰會上，阿裡雲大語言模型“通義千問”正式推出。

據介紹，通義千問是一個超大規模的語言模型，功能包括多輪對話、文案創作、邏輯推理、多模態理解、多語言支持，能夠幫助用戶續寫小說，編寫郵件等。現階段該模型主要定向邀請企業用戶進行體驗測試。

另外，阿裡巴巴決定未來將所有產品接入通義千問，進行全面改造。據悉，釘釘、天貓精靈將率先接入通義千問測試，評估認證後正式發佈新功能。阿裡巴巴集團董事會主席兼CEO、阿裡雲智能集團CEO張勇表示，面向AI時代，所有產品都值得用大模型重做一次。

目前，通義千問僅支持自然語言處理，尚不支持文生圖等跨模態功能，不過有知情人士稱，後續通義千問也會盡快推出相關大模型，能夠支持更多功能。

早在去年9月，阿裡巴巴就已經發佈通義大模型系列，包括通義M6、Alice mine以及視覺模型。單一模型可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10餘項單模態和跨模態任務。資源消耗也不高，以當時通義系列中的M6大模型為例，相同參數規模下訓練能耗僅是GPT-3的1%。

華為“盤古系列AI大模型”

4月8日至9日，由中國人工智能學會主辦的人工智能大模型技術高峰論壇將在杭州蕭山舉辦。有媒體從華為雲官網推測，華為即將上線的“盤古系列AI大模型”分別為NLP大模型、CV大模型、科學計算大模型（氣象大模型）。

其中NLP大模型是被認為最接近人類中文理解能力的AI大模型，而CV大模型首次兼顧圖像判別與生成能力。盤古CV大模型覆蓋工業質檢、物流倉庫監控、時尚輔助設計等行業;盤古NLP大模型覆蓋智能文檔檢索、智能ERP、小語種大模型等領域。

4月10日消息，針對上述情況，華為雲方面暫未回應。

與此同時，有媒體經從華為雲官方微信、微博等官方渠道查證，華為雲從未明確表示4月將發佈新的大模型，也從未透露過有關盤古大模型的產品計劃。華為雲人工智能領域首席科學傢田奇也並未在本次論壇中透露盤古大模型的產品上市計劃。知情人士透露，華為雲即將上線盤古系列AI大模型疑似資本炒作。

商湯日日新大模型

4月10日，商湯科技董事長兼首席執行官徐立宣佈推出大模型體系商湯日日新大模型體系。據悉，日日新大模型體系主要包括自然語言生成、文生圖、感知模型標註、以及模型研發功能，即“商量（中文語言模型）”、“秒畫(文生圖)”、“如影(數字人視頻生成)”、“瓊宇(場景生成)”，“格物(物體生成)”。

商量:使用大量數據訓練，並充分考慮中文語境，能夠更好地理解和處理中文文本。

秒畫:可幫助用戶輕松地創作高質量的藝術作品，自動生成元素和細節。

如影:可以幫助用戶輕松創作視頻，支持AI數字人動作表情、AI文案生成、AI跨語言文稿、AI素材生成的全棧式智能創作，卡通/真實多風格變換自如。

瓊宇、格物:它們是商湯科技基於神經輻射場技術（NeRF）的3D內容生成平臺，可基於3D內容生成技術實現對空間和物體的復刻與交互，大到城市數字孿生，小到桌面手辦，都能逼真復刻。

商湯方面表示，該技術主要面向B端，商湯日日新大模型體系目前僅面向政企客戶開放API接口，客戶可登錄商湯官網申請。

不過，商湯在現場展示秒畫時，有眼尖的網友發現商湯所演示的精選模型中出現AI模型站civitai的圖片，該模型底部有顯示civitai的文字水印，引發網絡質疑。

對此，商湯方面表示:秒畫SenseMirage包含商湯自研AIGC大模型，也提供第三方社區開源模型，支持導入多個平臺的開源模型或上傳用戶本地模型。用戶可免除本地化部署流程，並基於開源模型自訓練模型，高效地生成更多樣的內容。”在現場演示中，該模型底部有顯示civitai的文字註釋。

科大訊飛 “1+N認知智能大模型”

在今年3月舉行的滬港創新發展論壇上，科大訊飛集團總裁吳曉如表示，以ChatGPT為代表的技術表明機器在自然語言的處理能力上已實現質的飛躍，應該看到和Open AI的差距並迎頭追上。科大訊飛已儲備一段時間，很快會發佈自己的大模型技術。

4月11日，科大訊飛在互動平臺表示，訊飛依托認知智能全國重點實驗室的長期積累，於2022年12月份啟動生成式預訓練大模型“1+N”任務攻關，其中“1”是通用認知智能大模型算法研發及高效訓練底座平臺，“N”是應用於教育、醫療、人機交互、辦公、翻譯、工業等多個行業領域的專用大模型版本。

關於訊飛預訓練大模型的詳細信息將於2023年5月6日產品發佈會上進行發佈。

受此消息影響，科大訊飛和人工智能板塊大漲。

昆侖萬維“天工”3.5大語言模型

4月10日，昆侖萬維宣佈，其和奇點智源合作自研、中國第一個真正實現智能湧現的國產大語言模型 ——“天工”3.5發佈在即，並將於4月17日啟動邀請測試。未來，“天工”4和“天工”5也將與大傢見面。

“天工”大模型已經非常接近OpenAI ChatGPT的智能水平。ChatGPT是基於GPT3.5大模型，因此昆侖萬維把此版本命名為“天工”3.5。“天工”作為一款大型語言模型，擁有強大的自然語言處理和智能交互能力，能夠實現智能問答、聊天互動、文本生成等多種應用場景。

4月11日，昆侖萬維在前一天暴跌之後，當天強勢反彈大漲9.5%，其中盤中最高上漲近16%。

與此同時，昆侖萬維4月11日收深交所關註函，要求說明“天工”3.5可能面臨的風險。

4月13日，昆侖萬維回復深交所關註函時表示，“天工”3.5可能面臨的風險包括:技術研發進展不及預期的風險;應用實踐商業化不及預期風險等。昆侖萬維表示，目前公司AIGC、人工智能等業務產品尚未產生實際收入，預計對公司2023年財務狀況不會產生較大貢獻。

知乎“知海圖AI”中文大模型

4月13日，知乎創始人、董事長兼CEO周源在“2023知乎發現大會”上宣佈，知乎聯合面壁智能發佈中文大模型“知海圖AI”，邀請AI加入知乎“討論場”。

知乎方面表示，在特定場景中，把“知海圖AI”大模型的效果與GPT-4進行比較，兩個模型幾乎是持平的。

“知海圖AI”中文大模型已經運用進知乎熱榜，知乎首個大模型功能“熱榜摘要”上線並開啟內測，利用超強的語言理解能力對知乎熱榜上的問題回答進行抓取、整理和聚合，並把回答梗概展現給用戶。

受此消息影響，知乎美股盤前一度暴漲15%。

據悉，“知海圖AI”是基於面壁智能自主研發的CPM企業級大模型與ModelForce大模型系統。

面壁智能團隊早在2020年底就發佈首個中文大語言模型CPM-1，三年時間內又陸續發佈CPM-2、CPM-3和CPM-Ant、CPM-Bee等開源模型。

毫末智行“雪湖·海若”自動駕駛算法模型

4月11日，毫末智行正式官宣首個應用GPT模型和技術邏輯的自動駕駛算法模型，中文名“雪湖·海若”。

該自動駕駛生成式大模型“雪湖·海若”通過引入駕駛數據建立RLHF（人類反饋強化學習）技術，對自動駕駛認知決策模型進行持續優化，最終實現端到端自動駕駛。

據介紹，“雪湖·海若”通過引入駕駛數據建立RLHF技術，對自動駕駛認知決策模型進行持續優化，最終目標是實現端到端自動駕駛，現階段主要用於解決自動駕駛的認知決策問題。

目前，“雪湖·海若”實現模型架構與參數規模的升級，參數規模達到1200億，預訓練階段引入4000萬公裡量產車駕駛數據。

據解，2021年，毫末智行在推出數據智能體系MANA的同時，也宣佈要借助大模型提升數據處理能力，從而加速HPilot智能輔助駕駛產品的進化。

王小川成立“百川智能”

4月10日，搜狗創始人王小川正式宣佈入局中國大模型創業，和前搜狗COO茹立雲聯合創立人工智能公司，旨在打造中國版的OpenAI基礎大模型及顛覆性上層應用。

王小川在公開信中表示，新公司名為“百川智能”，目前已初步組建50人的團隊，獲5000萬美元啟動資金，爭取年內發佈國內最好的大模型和顛覆性的產品。

據悉，百川智能以前搜狗團隊為基礎，快速融合來自百度、華為、微軟、字節、騰訊等知名科技公司以及其他創業公司核心成員在內的數十位頂尖AI人才。

值得一提的是，近日，王小川與百度副總裁肖陽就國內大模型發展與OpenAI之間的差距問題，隔空打起嘴仗。

這場嘴仗源於王小川對李彥宏談及“百度的文心一言和OpenAI差距可能在兩個月左右”的觀點不認同。王小川表示:“怎麼可能隻差兩個月?那一定是（在）另一個宇宙。”如果用時間衡量的話，王小川認為OpenAI比國內領先三年時間。

針對上述觀點，百度副總裁肖陽回應稱:“百度做AI，始終相信長期主義的價值。我們向來不回避與國外的差距，但是這個差距到底在什麼位置，一線的都懂。天上一天，人間一年，王小川脫離一線太久，確實跟我們不在一個宇宙。”

今日凌晨，王小川回懟百度副總裁肖陽的言論。王小川稱，“什麼樣的平行宇宙裡，才能做到讓一個脫離一線15年的人，去懟一個脫離一線1.5年的人。”

馬斯克被曝入局大模型

據外媒援引知情人士稱，特斯拉CEO埃隆·馬斯克近日在推特內部啟動一項人工智能項目，用於公司的兩個數據中心之一。

知情人士透露，盡管馬斯克簽署呼籲暫停人工智能開發6個月的公開信，但其卻暗中在推特推進新的生成式人工智能（AIGC）項目，並為此購買上萬個GPU(圖形處理器)，還從谷歌的人工智能部門DeepMind招募人才。

該項目涉及創建一個生成式人工智能，推特將根據自己的海量數據進行訓練。一位消息人士稱，如果推特不打算將它們用於AI工作，幾乎沒有理由在數據中心級GPU上花費這麼多錢。

知情人士稱，馬斯克的人工智能項目還處於早期階段，盡管其購買如此多的額外計算能力表明他對這個項目給予很大期望。

此外，今年2月，馬斯克與人工智能研究人員接洽，商討成立一個新的研究實驗室，以開發ChatGPT的競爭對手。

值得一提的是，他不止一次在公開場合稱人工智能是一項危險的技術。就在幾周前，他還和人工智能研究界和產業界的大佬們一起簽署一篇公開信，呼籲全球所有實驗室暫停比GPT-4更強的AI模型研發，暫停時間至少為6個月。

（鞭牛士整理自澎湃、36kr、第一財經、每日經濟新聞等）

4月，國內大模型遍地開花

相關推薦

再次炸天的OpenAI 大模型生態初現

字節“亂跳”：遍地開花的業務，它急？

瘋狂的數字藏品，下一個造富神話？

國產大模型不談“性價比”

ChatGPT“一周年”國內表象：覺醒、追趕、商用、宮鬥、解散……

中國式ChatGPT“大躍進”

誰在“吊打”ChatGPT？

vivo自研70億藍心大模型7B開源：中文能力國內第一最適合中國開發者

Sora“炸場” 中美AI差距有多大？

一加海外新品官圖亮相：Nord 4采用拼色設計，與國內大不相同

字節示“AI”蘋果

李開復籌建新AI公司：目標不隻是中文版ChatGPT 希望全球招人

千億開胃菜中國電信開源12B星辰大模型：性能提升30%

武漢150歲杜梨樹開花：遊客紛紛前來打卡