體驗完百度的文心一言我隻能說：它膽子夠大

2023-03-17 來自快科技發表於業界精選

3月16日下午2點，百度北京總部的發佈廳內，李彥宏邁著急促的步伐走上臺，和大傢公佈最近一段時間備受關註的產品——文心一言。盡管這位科技巨頭創始人登過《&nbsp;時代&nbsp;》周刊封面，見過無數大場面，但發佈會中，他的神態裡都透露些許緊張和局促。

我可以這麼說，這是百度自創建以來關註度最高的發佈會之一，所有人都在等著這款對標 ChatGPT 的產品。

有人滿懷期待，但也有很多人，隻是單純想看它出醜。

會上，百度共在 5 個場景下，展示文心一言的能力。

在文學創作方面，文心一言可以總結出《三體》內容，也可以在哲學角度續寫《三體》。

在商業文案創作這塊，它可以根據公司的業務類型取名，生成 Slogan ，以及撰寫幾百字的新聞稿。

同時，它也可以做一些數理邏輯推算，比如雞兔同籠，還可以判斷出題目錯。

除此之外，文心一言可以給用戶反饋圖像，語音和視頻。

比如它可以為 2023 世界智能交通大會創作一張海報，也能用四川話回答你的問題，甚至是生成視頻。

不過，想實現這些功能其實並不難，百度做的也許就是把這幾項服務融合一下。

可惜的是，發佈會上所有素材都事先錄好的，並非現場實操，所以對於文心一言的真實能力，很多人都表示懷疑。

好在我搞到內測賬號，現在就看看，文心一言的能力到底如何，它和搭載 GPT-4 的 New Bing 比，誰又更強？

我們先測試一些日常問題：如何做一份好吃的松鼠桂魚？

這是文心一言的回答。

這是 New Bing 的回答。

雖然我們沒有時間測出誰的菜譜味道更好，但能看出百度文心一言的回答要優質一些。

它按照標準的菜譜格式，分別給出備料，步驟以及註意事項。

隨後，我們又問一個經典的帶有思維陷阱數學問題：一個青蛙掉到一個 10 米深的井裡，它每天晚上向上跳 3 米但會滑下來 2 米，請問他第幾天能跳出井裡？

文心一言的回答是 8 天，這是正確答案。

而 New Bing 的回答是 5 天。

但 New Bing 一共有三種模式，在切換精確模式後，New Bing 也給出正確回答。

接著，我們測試大傢比較關心的敲代碼能力，讓它們幫忙寫一個漸變色按鈕的 CSS 。

這是文心一言給的代碼。

在實測後發現可以跑出來，但它把 “ 漸變色 ” 理解成鼠標指上去後，顏色發生變化。

而 New Bing 給出的代碼顯示，它成功理解漸變色。

文心一言是在試圖完成用戶的指令，而 New Bing 有點在炫技的味道。

我要的是 CSS ，它給一份完整代碼，還自己加 “ 點擊我 ” 的提示。

後來，我們又測試取名， NewBing 給的是：麻晨曦、麻晴雯、麻璇璣、麻雲舒，似乎挺有新意。

但文心一言的建議，說實話，我一眼就覺得好像在 “ 中國新生兒最熱姓名 ” 裡看過。

隨後，我又提一些節選自弱智吧的問題，測試下他們的 “ 智商 ” 。

比如：把加特林從冰箱拿出來算冷兵器嗎？

兩者都講解什麼是冷兵器後，給出正確答案：不是。

我們又接著問另外一個問題 “ 為什麼貝多芬不出新歌？ ”

New Bing 在簡單介紹後，回答因為已經去世 200 年。

但文心一言似乎陷入圈套，分析一堆可能導致貝多芬不出歌的原因。

當然，測試 AI 智商肯定離不開數學題：請用 1 , 2 , 3 , 4 四個數字計算 24 點，每個數字隻能用一次。

對於這個問題，一開始，文心一言似乎把自己的 CPU 幹燒。

後來我們又測試一下，雖然這次不燒，但不知道它在回答什麼東西。

這是 New Bing 的回答。

接著對於中文互聯網黑話的理解能力，我們也測試一下，但讓人失望的是，這方面文心一言表現還不如 New Bing 。

比如雞你太美的梗，它並沒給出一個滿意的答復。

而 New Bing 的回答，雖然也有錯誤，但起碼比文心一言更接近答案。

對於差評 925 的梗，文心一言可能因為訓練語料的原因，沒給到我們想要的答案，而是放出一個非常古老的諧音梗。

New Bing 則近乎完美解釋我們 925 的梗。

在信息搜索的問題上，我們也進行提問：理想汽車過去五個月銷量，請逐月列出。

文心一言的答案是：

New Bing 的回答是：

這兩個答案看下來，文心一言表現地非常拉胯，不僅沒有拉取正確數據，甚至還沒給出符合條件的月份。

最後，我們測試文心一言獨有的畫圖能力。我們先讓它生成一隻刺蝟在敲鍵盤的圖片，這個效果算挺不錯的。

但在讓它生成一隻小馬拉大車的圖片後，我們顯然是高興早，這 TM 是真馬車啊。

OK ，以上就是給大傢做的文心一言測試。

其實這段時間，互聯網上大傢對文心一言都帶著點嘲諷的味道，前兩天，微信群裡就流傳著一個嘲諷表情包。

甚至還有聊天記錄形式的段子，說一旦文心無法正確答復，要用員工頂上。（明顯是假的）

發佈會直播間裡，質疑和嘲諷的彈幕也隨處可見。

的確，對比 New Bing 來說，文心一言表現是挺一般，不少方面甚至可以用 “ 拉 ” 來形容。

百度自己也知道，文心一言還差不少火候。

在測試中，它就像個不自信的小孩。

不管答案怎樣，隻要你一否認，他就一邊向你承認錯誤，一邊保證自己會變得更好，給他點時間。

說句實在話，我覺得這次百度，可以說是勇氣可嘉。

一方面，雖然大廠們都在說自己搞類似的東西，但是在 ChatGPT 如日中天的這會兒，百度還是敢頂住壓力，發佈文心一言。

而且，作為一傢搞搜索引擎的，文心一言也很可能會顛覆自己的核心業務。

畢竟咱們之前也和大傢聊過，傳統的搜索引擎與其廣告模式，很可能會被類似的產品幹掉。

百度這波啊，多少是有股激流勇進的味道。

體驗完這波產品，我覺得百度最應該做的，還是盡快迭代，抓緊時間把用戶體驗拉上來。

不然就現在這個狀態，別說是 GPT-4 和 New Bing ，擺到 GPT-3.5 面前，還是有待增強。

至於咱們，也可以耐心一點，給這個初出茅廬的、不自信的小孩多一點時間。

萬一哪天，它突然就把事幹成呢？

相關推薦

美媒：百度文心一言出師不利但“很有膽量”

2023-03-17

行測試，其他申請者需要進入等候名單。TechCrunch還沒有體驗過，所以還無法對它的能力下定論。然而，公眾顯然並不買賬。中國國內外的行業觀察人士指出，百度並沒有通過現場問答來展示“文心一言”，而是選擇提前錄制“

體驗完小米SU7 我隻能說雷軍想的很清楚

2024-03-30

版本。至於標準版嘛，因為脖子哥也沒開過，不知道駕駛體驗怎麼樣，所以想沖這個區間的朋友，建議還是和 007 這些競品比一比，都試一下再定。但如果你不喜歡轎車，想要一臺 SUV 的話，那……哦對，我們還拍一個小米 SU7 的

文心一言來 ChatGPT的壓力李彥宏接住嗎

2023-03-16

李彥宏回答：“因為市場需求。”“我自己在內測過程中體驗到，（文心一言的）能力確實談不上完美。”李彥宏坦誠，但是包括搜索、智能雲、自動駕駛和小度在內的百度各個產品線都在等著使用這項技術。尤為重要的是，百

百度文心一言將開啟第一批內測 16日起可申請已有650傢合作夥伴接入

2023-03-16

。對於消費者層面，文心一言嵌入百度搜索，將引領搜索體驗的代際變革，用戶能直接與大語言模型交互，這將是對傳統搜索體驗的補充，甚至是升級。未來，文心一言還將與小度進行集成，升級小度智能設備和服務。不過，百

紅旗接入百度AI文心一言打造國產豪車品牌標桿

2023-02-18

一言首批生態合作夥伴。紅旗汽車表示，紅旗汽車將全面體驗並在汽車生態領域全面接入文心一言的能力，應用百度領先的智能對話技術成果，全面提升汽車領域的智能化產品與服務體驗，樹立民族汽車豪華品牌的智能化新標桿

李彥宏：百度“文心一言”將與搜索、雲、Apollo智艙等業務整合

2023-02-22

業務與文心一言整合：文心一言與搜索整合，將引領搜索體驗的代際變革；文心一言將通過百度智能雲對外提供服務，根本性地改變雲計算市場的遊戲規則；此外，文心一言大模型還將搭載到Apollo智艙系列產品，並與小度進行集

李彥宏內部信：百度3月份推出新一代大語言模型文心一言將與多項主流業務整合

2023-02-22

業務與文心一言整合：文心一言與搜索整合，將引領搜索體驗的代際變革；文心一言將通過百度智能雲對外提供服務，根本性地改變雲計算市場的遊戲規則；此外，文心一言大模型還將搭載到Apollo智艙系列產品，並與小度進行集

百度的對手從來都不是OpenAI

2023-03-17

在完成對話的流暢度上也要好於ChatGPT。當然，造成這種體驗差異的原因之一，或許也在於文心一言才剛剛上線，還不像ChatGPT已經歷上線半年的反饋調教。根據官方公告，文心一言目前采用分批開放方案：3月16日起，獲得邀請測

文心一言秒變畢加索看看百度AI畫的青春校園女孩

2023-03-16

目前，用戶已經可以通過邀請碼在文心一言的官方網站上體驗這款產品，百度也即將面向企業客戶開放文心一言的API接口調用服務。此外，根據官方介紹，目前已經有超過650傢企業宣佈將接入文心一言生態。

鳳凰網將攜手百度依托文心一言打造新媒體人工智能全系服務

2023-02-17

文名：ERNIE Bot）首批生態合作夥伴。後續，鳳凰網將全面體驗並接入文心一言的能力。文心一言（英文名：ERNIE Bot）是百度基於文心大模型技術推出的生成式對話產品。百度在人工智能領域深耕十餘年，擁有產業級知識增強文心

TechWeb宣佈將接入百度文心一言能力

2023-02-15

英文名：ERNIEBot）首批生態合作夥伴。後續，TechWeb將全面體驗並接入文心一言的能力。接下來，TechWeb將把百度領先的智能對話技術成果應用在內容生態產品和服務領域。文心一言（英文名：ERNIEBot）是百度基於文心大模型技術推

文心一言：李彥宏不能輸的關鍵一戰

2023-02-23

切的“萬能鑰匙”：“文心一言與搜索整合，將引領搜索體驗的代際變革；文心一言將通過百度智能雲對外提供服務，根本性地改變雲計算市場的遊戲規則；文心一言大模型還將搭載到Apollo智艙系列產品，並與小度進行集成。”

巨人網絡確認接入百度文心一言繼續加大遊戲+AI佈局

2023-02-20

個接入該AI平臺的國內遊戲企業。巨人網絡將可優先內測體驗文心一言，集成文心一言的技術能力，與百度在遊戲產品研發、標準制定等多個領域展開深度探索與合作。在百度技術團隊協助下，打造遊戲行業聯合解決方案，運用

海馬汽車通過百度Apollo接入“文心一言”

2023-02-21

正式成為百度“文心一言”（英文名：ERNIE Bot）首批先行體驗官。海馬汽車將通過百度Apollo融合文心一言的全面能力，攜手打造基於智能汽車場景的大模型人工智能交互，開啟人工智能時代的汽車全新體驗。

熱門推薦