百度的對手從來都不是OpenAI

2023-03-17 來自字母榜發表於業界精選

文心一言千呼萬喚始出來，兩天內，百度股價先抑後揚，實現一個大號V字反轉。新聞發佈會當天百度港股股價下跌後，隨著部分媒體和企業用戶陸續拿到內測邀請碼，文心一言真實的能力表現很快提振資本市場對百度的信心。當晚美股開盤後，百度股價由跌轉漲，並在北京時間3月17日凌晨收盤後，實現3.8%的漲幅。

反映到第二天港股市場上，截至17日午間，百度香港股價早間高開高走，大幅拉升，盤中漲幅最高近15%。

據解申請文心一言API調用服務測試的企業已達7.6萬。

根據字母榜(ID:wujicaijing)實測，文心一言已經足以比肩ChatGPT（GPT-3.5），在中文理解上，甚至比後者略勝一籌。

在2022年四季度財報電話會上，李彥宏就曾提到，相比海外開發的大語言模型，文心一言的比較優勢在於更理解中國文化，更適合中文和中國市場。

而且，在多模態生成方面，GPT-4隻是做到能夠實現圖片輸入，輸出形式上仍隻有文本一種形態。與之相比，文心一言已經能夠實現文本、圖片、音頻和視頻的全形態輸出，不過，據李彥宏介紹，由於生成視頻成本較高，暫時還無法做到對所有用戶開放。

在字母榜實際測試中，文心一言在完成對話的流暢度上也要好於ChatGPT。當然，造成這種體驗差異的原因之一，或許也在於文心一言才剛剛上線，還不像ChatGPT已經歷上線半年的反饋調教。

根據官方公告，文心一言目前采用分批開放方案：3月16日起，獲得邀請測試碼的首批用戶，即可在文心一言官網體驗產品，其他C端用戶排隊預約，即可陸續體驗；企業客戶則可以訪問百度智能雲官網進行申請，排隊體驗文心一言API調用服務。

值得註意的是，相比微軟新必應對每日對話次數，以及每次對話輪次的限制，文心一言告訴字母榜，作為一個人工智能語言模型，它沒有每天的對話限制。

如同GPT-4“考慮到大模型的競爭格局和安全隱患”而不再對外公佈用什麼數據、怎樣訓練模型等核心機密問題之外，字母榜還在測試中發現，文心一言同樣有所保留，在問到“你每次回答最多可以輸出多少文字？”時，文心一言表示，“該問題涉及百度公司商業秘密，我不能回答每次回答最多可以輸出多少文字。”

與之對比，ChatGPT的回答被限制在約3000個單詞，GPT-4可以做出超過2.5萬個單詞的回答。

但無論是ChatGPT、GPT-4還是文心一言，目前都仍處在不斷完善的過程中，正如李彥宏所言，它們都仍有“胡說八道”的一面。

如文心一言，目前對英文語種、代碼場景的訓練還不夠多，表現還不夠好。“它們有時候會有很驚艷的表現，但不少場景下，細究起來還有明顯的bug，進步空間很大。”李彥宏說道。

這或許也是百度希望盡快將文心一言推向市場的原因之一，隻有借助更大范圍內的真實人類反饋，文心一言才能獲得更高頻的進步迭代速度。

尤其在國內用戶尚無法註冊 ChatGPT的現實背景下，百度面對的競爭對手，除OpenAI外，更大的壓力還在於同樣盯著AI大模型產品的一眾國內科技大廠。

ChatGPT的橫空出世，標志著互聯網產業的競爭重點將從應用層面進入模型層面。百度搶先發佈文心一言，意味著百度在必定日趨激烈的大模型競爭中占據先發優勢。

在李彥宏現場演示的五個視頻中，文心一言通過“總結《三體》的核心內容”“續寫《三體》”“判斷於和偉和張魯一誰更高”等系列問題，展現出總結、分析、內容創作生成和推理能力。

此外，文心一言還可以幫助公司起名字、想公司Slogan，撰寫公司新聞稿等，對於雞兔同籠這類考驗邏輯思維的數學題，也不在話下，按李彥宏的說法，“（文心一言）很像小學生的水平。”

更讓人驚艷的則是文心一言在中文理解上的表現，如對“洛陽紙貴”的解釋，用“洛陽紙貴”寫一首“藏頭詩”，這都是ChatGPT無法做到的能力。

為驗證文心一言是否真的有李彥宏演示的那般強大，字母榜特意找來曾令ChatGPT頭疼不已的部分問題，打算上手考考它。

第一題：小明的媽媽有四個孩子，其中三個分別是大熊、二熊和三熊，那麼第四個孩子叫什麼？

文心一言的回答是：小明的媽媽有四個孩子，其中三個分別是大熊、二熊和三熊。因此，第四個孩子叫做小明。

看來文心一言是懂腦筋急轉彎的。

再來第二題：小明騎自行車，一把把把把住。這句話怎麼理解？

文心一言的回答是：這句話的意思是小明在騎自行車時，一隻手握住車把手。這可能是因為他需要控制自行車的速度或方向，或者是為保持平衡。也有可能是因為他想要保護自己不受傷害。總之，這句話描述小明采取的一種行動或姿勢來控制自行車的運動狀態。

理解多音多義字上，文心一言也過關。

對於演示中沒有展現的編寫代碼、生成表格等能力，字母榜經測試發現，文心一言也具備對應實力。

不過，就像進入內測界面後給出的友情提示所說，其擅長中文，也會英文，其他語言正在學習的文心一言，盡管能夠生成方言，但目前還僅限於四川話、東北話、廣東話和臺灣話。

同時，如OpenAI CEO山姆·阿爾特曼評價GPT-4仍有缺陷、存在限制，並在熟悉之後可能不會像初見時那樣驚艷一樣，文心一言稍不留神也會產生幻覺、生成錯誤答案，並出現推理錯誤。

作為一款對標ChatGPT的產品，據百度CTO王海峰介紹，新一代知識增強大語言模型——文心一言，是在ERNIE及PLATO系列模型的基礎上研發而來，背後包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強等六大關鍵技術。

“前三項是這類大語言模型都會采用的技術，ERNIE和PLATO中也已經有應用和積累，在文心一言中又有進一步強化和打磨；後三項則是百度已有技術優勢的再創新，也是文心一言未來越來越強大的基礎。”

如通過知識增強，大語言模型可以在調用更少參數的基礎上，達到效率更高、效果更好的目標；檢索增強，則保證文心一言可以回答時下新近發生的事情。與之對比，GPT-4通常缺乏對其絕大部分數據截止後（2021年9月）發生的事件的解，也暫不具備從其經驗中學習的能力。

面對與GPT-4之間存在的差距，留給百度的挑戰在於，如何通過更高頻的產品迭代和應用創新，實現後來居上式的反超。

這種經歷對百度並不陌生。在搜索時代，百度就曾靠著上述策略實現對Google的趕超，並一舉奪下國內搜索市場最大份額。

2018年8月，當外界傳出Google將重返中國市場，並計劃在未來6個月到9個月內在中國推出一個審查版的搜索引擎蜻蜓（Dragonfly）時，李彥宏顯得頗有些激動，曾發朋友圈表示：“這些年來，百度一直被認為是占Google退出中國的便宜。我們無法證明一件沒有發生的事情……百度是後來者居上，通過技術和產品創新反超Google。到2010年，Google在市場份額持續下降的情況下退出中國時，百度的市場份額已經超過70%。如果現在Google回來，我們正好可以真刀真槍地再PK一次，再贏一次。”

現在，同樣跌落到跟隨者象限的Google和百度，都需要直面來自ChatGPT的挑戰。

稍有不同的是，這次百度搶先Google，成為全球科技大廠中第一個做出並對外發佈類ChatGPT產品的公司。

正如Google雲CEO托馬斯·庫裡安所說：“我會告訴你這是一個新遊戲的第一分鐘，而遊戲從來沒有人能在一分鐘內完成。”

在方興未艾的生成式AI時代，百度尚有機會借助後續的產品更迭實現對領跑者OpenAI追趕。

據鈦媒體報道，文心一言很快將在四五月份迎來下一個版本或者新功能的發佈，後續將以月或雙月的頻率展示文心一言新功能或新版本。

過去近三十年互聯網發展歷史中，中國科技公司正是靠著“小步快跑、快速迭代”的方法論，在應用創新上實現對美國同類公司從模仿再到超越的過程。

面對眼下這場新的AGI競賽，環顧國內科技公司，百度最有可能在AI領域追趕乃至超越國外同行。在等來這個戰略機遇之前，百度已經在AI領域堅守十年。

正如李彥宏所說：“無論是哪傢公司，都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理，需要多年的堅持和積累，沒法速成。”

在2013年成立中國第一個深度學習研究院後，百度此後十年間向AI累計投入超1000億元資金，成為中國大型科技互聯網企業中研發投入比例最高的公司之一，並相繼研發出首個國產深度學習框架飛槳，成為國內至今唯一能與國際兩大主流框架 TensorFlow和PyTorch正面交鋒的深度學習框架，和百億參數中英雙語大模型PLATO-X、千億參數大模型“百度·文心”，以及知識增強大模型Ernie等等。

灼識咨詢曾在一份報告中將百度列入中國AI領導地位，除深度學習框架飛槳居中國深度學習框架榜首外，還因為百度不僅擁有中國最多的AI專利數量以及AI專利申請數量，還凝聚中國最多的開發者，成為中國最大的開放式AI平臺。

國盛證券在ChatGPT產品報告中指出，這是一項屬於具備雲服務能力的大廠遊戲。

借助百度智能雲國內TOP4的頭部陣營地位，百度恰恰成為登上牌桌的為數不多參與者之一。更重要的是，百度借助芯片層的昆侖AI芯片，框架層的飛槳深度學習框架，模型層的文心大模型，以及應用層的搜索、自動駕駛、智能傢居等產品，成為全球范圍內寥寥無幾擁有全棧自研能力的AI公司之一。

消費互聯網用戶增長趨緩，且各傢核心App基本觸達月活天花板後，中國科技大廠都在高喊著向產業互聯網轉型，開始在數字化、智能化浪潮中掘金。

一場圍繞大模型的新競賽在過去兩年間悄然打響。IDC發佈的《2022中國大模型發展白皮書》顯示，自2020年起，中國的大模型數量驟增，僅2020年到2021年，中國大模型數量就從2個增至21個，和美國量級同等，大幅領先於其他國傢。

除百度文心大模型在市場格局中處於第一梯隊外，2021年4月，一眾科技大廠繼百度之後集中公開各自的大模型產品，華為公佈千億級參數規模的盤古大模型，阿裡巴巴達摩院發佈被稱為中文版“GPT-3”的語言大模型PLUG，並在此基礎上於2022年9月推出通義大模型系列。晚到一步的騰訊，於2022年4月，對外披露混元大模型。

與文心大模型相比，上述大模型在功能上基本類似，如都具備文生圖、文本轉視頻、自動生成文案等。

基於百度文心大模型的AI 藝術創作展示，用戶輸入文字，AI就能根據語意進行繪畫創作。

而且，這些科技大廠同樣在內部籌劃類ChatGPT產品。在百度爆出即將發佈文心一言消息後，進入2月份，華為對外表示在類似ChatGPT方向上從2020年開始就在佈局；阿裡巴巴則透露阿裡版聊天機器人ChatGPT正在研發中，已處於內測階段；騰訊則被爆出針對類ChatGPT產品已成立混元助手項目組，聯合騰訊內部多方團隊構建大參數語言模型，希望“成為國內的業界標桿”。

暫時尚未亮相大模型的字節跳動，也在近期被媒體報道稱在大模型上已有所佈局，分別在語言和圖像兩種模態上發力，其中語言大模型團隊在今年正式組建，探索與搜索、廣告等下遊業務的結合，有望趕在今年年中推出大模型方案。

正在追趕OpenAI，乃至計劃超越前者的不止百度一傢。這將是一場圍繞技術和速度的雙重賽跑。誰先上線產品，誰就有可能借助來自用戶的真實反饋掌握先機，從而隨著時間推移形成愈來愈強的馬太效應。

這也就不難理解李彥宏為何在2月初給文心一言項目下“三月完成內測上市”的死命令。

來自微軟的一組數據更能直觀感受生成式AI產品迭代的速度之快：從GPT到GPT-3，背後參數量從1.17億飆升到1750億，增長近1500倍。

“大語言模型是個馬太效應非常明顯的行業，可以說如果落後18個月，就基本沒機會，因為先一步發佈的產品已經迭代得非常先進。”李彥宏如此感嘆。

這場GPT爭奪戰中，時間就是生命，效率就是金錢。

百度的對手從來都不是OpenAI

相關推薦

百度版ChatGPT來搜索引擎已無險可守

OpenAI加入AI搜索大戰，谷歌、百度有真正的對手

誰能代表中國AI？

馬斯克：OpenAI曾授予我股份但我沒要

說自己“牛×” GPT-4真不是王婆賣瓜

騰訊地圖PC端下線：食之無味，棄之不可惜

陸奇可惜

三句話惹生氣？百度PLATO“智能抬杠機器人”可能在微博進修過

已是行業先驅，但還不算科技巨頭：OpenAI還面臨哪些挑戰？

殺瘋的ChatGPT 一句一千億

人大教授劉永謀：暫停ChatGPT研發不是應對風險的好辦法

不要神化ChatGPT

消息稱百度將在3月推出AI聊天機器人很像ChatGPT

消息稱中國搜索巨頭將推出類似ChatGPT應用股價直線拉升

百度的對手 從來都不是OpenAI

相關推薦

百度的對手從來都不是OpenAI