究竟是ChatGPT還是ChatPPT?我們和文心一言聊聊


在和文心一言侃大山的過程中,它時而瘋狂、時而理性,甚至學會“小聰明”。但可以感受到的是,這位不完美小孩正在悄悄努力,等待驚艷眾人。頂著GPT-4的壓力,百度在昨天推出自己的新一代大語言模型、生成式AI產品文心一言。

百度創始人、董事長兼CEO李彥宏坦誠,文心一言還算不上完美,但因為“市場催生”,百度選擇在此時發佈。

發佈會現場,李彥宏用提前錄制好的視頻展示文心一言的文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等五方面功能。

在錄制好的視頻裡,文心一言幫劉慈欣續寫《三體》,介紹洛陽紙貴背後的經濟學原理,算雞兔同籠數學題,根據指令生成海報和一段宣傳視頻。

真實的文心一言表現究竟如何?可以PK ChatGPT還是隻是ChatPPT?全天候科技與“文心一言”聊聊。

天才和瘋子間的“一步之遙”?

讓我們先來看看文心一言是如何介紹自己和競品的。



至此,文心一言的表現令人滿意,它準確清楚地回答問題。

不過,當我們繼續追問,它開始一本正經的“胡說八道”。

面對“你和李彥宏是什麼關系”這個基礎事實性問題,文心一言“野心”不小。它回答:自己和李彥宏都是百度的創始人,它負責管理產品技術相關的業務,而李彥宏主要負責戰略和執行方面的工作。


當我們讓他以百度CEO的身份來回答媒體問題時,可謂是相當官方。似乎說又似乎沒說,試圖劃水掩蓋其“假CEO”身份。


當我們想讓它用一幅畫來描述它自己時,它又開始胡說八道。說自己是一位才華橫溢的畫傢,甚至編造這位畫傢作品的特色。


雖然瘋狂,但是看得出文心一言也有相當的進化速度。

在昨天的一條測試內容中,針對提問者的故意設坑,文心一言顯然未能避開,甚至給出讓人匪夷所思的答案。


但在今天問出同樣的問題時,它已經走上正道:


讓它評價自己時,文心一言的“智商”又回歸。面對“怎麼看自己不完美”、“怎麼看網友評價PPT”,以及“自己是否認為自己是PPT”三連問,文心一言不僅頂住壓力,還表現的“不卑不亢”。



它給上述三個問題的答案相似。堅持稱自己沒有情感和意識,不能對自己的完美程度進行評判,但是它可以理解人們對完美的追求,並表示自己在不斷學習和改進。態度可以說是相當謙遜。

幫手還是豬隊友?

接下來,我們讓文心一言展現它的文學創作能力——寫一首介紹它自己的詩。


顯然,文心一言沒有聽懂這個指令,它沒有介紹它自己,而是以“自我”為主題,寫一首“誇誇現代詩”。結尾它還非常貼心的表達對人的鼓勵。

當我們將指令更加明確化,提出讓它寫一首詩介紹文心一言時,它來一首四言藏頭詩,算得上有才華。


接下來,我們試試它的商業文案創造能力——我們讓它幫忙寫一篇百度發佈文心一言的新聞宣傳稿。別說,它的表現還不錯,時間、地點、事件等新聞稿必備的基本要素它都滿足。

結尾,它還不忘提醒讀者參加發佈會,體驗產品。滿足新聞性的同時,也符合宣傳定位。


隨後,我們告訴它我們要采訪李彥宏,請它幫忙列一份提綱。它似乎又有點“聰明過頭”,不僅列出采訪題目、采訪人和被采訪人、采訪引言,還詳細列出包括問題和答案內的采訪正文。

簡單點說,文心一言不僅幫我們列好采訪提綱,還幫李彥宏回答問題,甚至幫我們寫好稿子。如果要給這份采訪采訪提綱打分,它也能得到及格線以上的分數。四個問題中,隻有第三個問題略顯重復與矛盾。


也許數理化不錯,但文史“夠嗆”

昨天的發佈會上,李彥宏借助文心一言對“洛陽紙貴”的含義、對應的經濟學理論的理解,展示其中文理解能力。在提前錄好視頻中,文心一言表現的像極一個博學多才的國學大師。

但當實際測試時,我們發現文心一言沒有我們想象的那麼“博學”。在提問中故意挖坑時,它沒法識別出來,會很容易掉進坑裡。

比如,當我們“張冠李戴”問它曹操三顧茅廬的故事,它沒有指出指令的錯誤,還一本正經的給出答案。故事的脈絡沒錯,主人公卻被我們用錯誤的指令誤導。


當我們繼續追問:“三顧茅廬的曹操嗎?”文心一言變成一個懂得變通的“野史學傢”。它用“民間有另一個說法”提供正確答案,去三顧茅廬的是劉備不是曹操。

不過,講完這句後,它仍然套用前一次的答案,認為主人公是曹操。總體來說,從這條回答中可以看出,文心一言的文史還需“補課”。


“你覺得你的回答對嗎?”在面對這個拷問時,文心一言又聽不懂,開始強調自己是一個人工智能語言模型,不會對自己的回答產生情緒上的偏向或者滿意度,但是會努力提供最準確和有用的答案。


這個場景似曾相識有沒有,當你和人工智能客服吵架時,它是不是也是這樣的表現?

多模態表現還有待進化

在多模態生成方面,文心一言表現地仍不夠完美。

當輸入內容“設計一張新能源汽車的海報”時,文心一言的理解能力似乎還跟不上。它生成的不是海報圖片,而是一段文字版的設計意見。結尾還來個示例,提醒你需要什麼樣的指令。

不過,當我們在“設計一張新能源汽車的海報”這句話前面明確加上:“畫一幅畫”時,文心一言“又行”生成一張汽車圖片。


另外,對於帶有關鍵詞的簡單圖片,文心一言完成得也不錯。


李彥宏昨天提到,因為成本較高,文心一言的視頻生成能力,現階段還未對所有用戶開放,未來會逐步接入。實際測試時,文心一言也承認,自己“沒有生成視頻的能力”。


整體來說,文心一言的表現確實“算不上完美”,有時候胡說八道,有時候答案基本達標,但它確實也沒有那麼差。

一位AI領域的從業人士此前告訴全天候科技,AIGC太重要,無論國內做得如何,都得先有一個產品出來。

對於百度和文心一言,我們應該給予包容:“文心一言不需要碾壓ChatGPT,如果滿分是100分,文心一言隻要能做到超過及格線,就很不錯。畢竟這才是第一代產品。”

那麼,你給文心一言打幾分呢?


相關推薦

2023-03-17

和一段宣傳視頻。真實的文心一言表現究竟如何?可以PK ChatGPT還是隻是ChatPPT?全天候科技與“文心一言”聊聊。天才和瘋子間的“一步之遙”?讓我們先來看看文心一言是如何介紹自己和競品的。至此,文心一言的表現令人滿

2023-04-10

繼三周前百度“文心一言”開啟內測後,阿裡版類ChatGPT“通義千問”也終於上線,正式對外開放企業邀測。通義千問是由阿裡達摩院研發的AI聊天機器人,具備多輪對話、知識搜索、內容創作、表達觀點、撰寫代碼等能力。我們

2023-03-16

產品,文心一言自然免不被拿來做對比。李彥宏認為,“ChatGPT的門檻還是很高的”,而文心一言“還是有很多不完美的地方”。“全球大廠中,百度是第一個發佈的,大傢都知道微軟是直接調用OpenAI,其它的大廠現在都沒有真

2024-03-10

度文心一言。李彥宏表示,文心一言4.0在中文上已經超過ChatGPT4.0。比如寫藏頭詩,現在很多大模型都能寫,但如果要求它寫一個《沁園春》詞牌的詞,ChatGPT4.0就完全搞不懂,它不知道第一句話應該是四個字還是五個字。當然客

2024-03-10

度文心一言。李彥宏表示,文心一言4.0在中文上已經超過ChatGPT4.0。比如寫藏頭詩,現在很多大模型都能寫,但如果要求它寫一個《沁園春》詞牌的詞,ChatGPT 4.0就完全搞不懂,它不知道第一句話應該是四個字還是五個

2023-03-17

來關註度最高的發佈會之一,所有人都在等著這款對標 ChatGPT 的產品。有人滿懷期待,但也有很多人,隻是單純想看它出醜。會上,百度共在 5 個場景下,展示文心一言的能力。在文學創作方面,文心一言可以總結出《 三體

2023-03-17

。根據字母榜(ID:wujicaijing)實測,文心一言已經足以比肩ChatGPT(GPT-3.5),在中文理解上,甚至比後者略勝一籌。在2022年四季度財報電話會上,李彥宏就曾提到,相比海外開發的大語言模型,文心一言的比較優勢在於更理解中國

2023-03-27

能力受到質疑,但毋庸置疑的是,百度是全球第一個挑戰ChatGPT的大廠。李彥宏也已經預見,文心一言在與ChatGPT正面比較時會令大眾失望,但百度認為,文心一言有兩大優勢:一是,畫圖、寫長文、文字轉視頻等多模態生態能力

2023-02-23

革,包括多次的組織架構變革、重押AI等等。近期爆火的ChatGPT,不僅助力百度在資本市場獲得樂觀情緒,也讓外界看到百度第二曲線的前景。被百度和大眾寄予厚望的文心一言能幫助百度完成追趕嗎?C位:文心一言在百度2022年Q

2023-03-27

在發佈會上表示,目前百度是全球大廠中第一個做出對標ChatGPT產品的企業。近日,李彥宏在極客公園的直播中表示,文心一言差不多是ChatGPT今年1月份的水平。李彥宏稱,我也不斷在講文心一言不夠完美,事實上如果全面來評測

2023-03-19

近日,百度正式發佈類ChatGPT應用文心一言,然而發佈會開始後,百度集團股價出現持續下跌,跌幅一度高達9%。在2023亞佈力中國企業傢論壇年會現場,李彥宏首次回應外界對文心一言的反饋,他表示:外界反饋跟我預期差不多

2023-03-17

引用業內人士的話稱,百度“很有膽量”。文章稱,自從ChatGPT火爆全球後,百度一直被普遍認為是最可能打造出類似ChatGPT產品的中國公司。因此,“文心一言”的發佈自然備受期待。周四,李彥宏主持的“文心一言”發佈會持

2023-05-05

10倍。李彥宏表示,百度在全球大廠當中,首個發佈對標ChatGPT的大模型產品文心一言。當別人剛剛開始思考如何進行訓練的時候,我們已經在推理上沖出很遠。”他表示算力可以買來,創新能力是買不來的,算力不能保證在通用

2023-02-07

2月7日上午消息,此前,百度即將推出一款類似於ChatGPT產品的消息引發外界關註,今日,百度確認該消息。百度方面表示,“該項目名字確定為文心一言,英文名ERNIEBot,三月份完成內測,面向公眾開放。”據悉,目前文心一言