谷歌的“GPT”終於憋出來但也就和百度打得有來有回

2023-03-23 來自差評發表於業界精選

不知道大傢還記不記得，上個月初Google畫個Bard的大餅，結果畫餅時犯低級錯誤，讓網友嘲諷半天，甚至公司股價都在當天狂跌1000多億。不過也不知道該說Google夠肝還是夠勇，在閉關修煉一個多月後，還是在昨晚正式放出Bard。

幸運的是，我們編輯部在第一時間就搞到資格，狠狠地體驗一波。

先說結論，有點失望。

Bard 上來就讓我不爽一下。因為現階段它隻對美國和英國開放，所以和它對話隻能用英文，而且它的回復也隻能用英文。

不是，你守著個Google翻譯，也不舍得稍微用一下？哪怕告訴我這是機翻的也行……

明明自己吹牛說能理解翻譯回答包括中文在內的200多種語言

為表示對 AI 們的一視同仁，我一上來就問個弱智吧經典：

玉皇大帝應該住在平流層還是對流層？

Bard 看出我們在問題裡埋的坑，直接說玉皇大帝並不真實，所以兩個都不住。

這沒有什麼大毛病，和 GPT、文心一言們沒什麼差別。

但在後續的一系列測試裡，這應該是 Bard 回答得最好的一個問題。

更進一步，我們問個前幾天給 GPT 們測過的另一個抽象問題：

直角是 90 度，開水是 100 度，那麼開水是鈍角嗎？

結果這貨的小腦袋瓜宕機。

而文心一言的表現也一樣抽象……

相反，new Bing 回答得就有理有據。

接下來，我們讓它對比自己和 GPT-4。

“ 你能比較下自己和 GPT-4 嗎？”

Bard 和 GPT 不同，它一次能生成 3 個答案，大傢可以根據自己的需求去選擇。

而在這個問題下，Bard 的 3 個回答中，2 個大方承認自己比 GPT-4 落後，但還有 1 個回答避重就輕地嘴硬自己更強。

嘴硬麼也正常，但 Bard 的回答裡出現事實錯誤。

其中一個回答裡，Bard 把已經發佈的 GPT-4 說成沒發佈；而在另一個回答裡，它把 GPT-3 使用的 1750 億參數套到 GPT-4 頭上，妥妥的胡說八道。

向下滑動

這就奇怪，Bard 明明是聯網的，數據怎麼會有問題呢？

為試試它數據扒得好不好，我把同樣聯網的 new Bing 也拉出來，問它們一個新鮮問題：

今天 NBA 常規賽，雷霆和快船誰贏（ Who won the NBA Regular season between the Clippers and the Thunder today ）。

但這裡有個雷點。英文提問可能會被誤解成 “ 今天雷霆和快船誰贏得常規賽冠軍 ”。

new Bing 就被我的錯誤提問繞暈，說自己不知道誰贏，但它又找到一些信息，裡面就有雷霆 101-100 戰勝快船的消息。

另一邊的 Bard 看起來好像是理解我的問題，還找到兩隊比分是 101-100，但它卻又偏偏說是快船以 100-101 贏得比賽。

得要我指出它有錯誤，讓它重新檢查，它才改正過來。

數據是扒對，但這理解能力好像不太行。那不用聯網的數學題呢？

我們問一個經典的易錯題：

一個青蛙掉到一個 10 米深的井裡，它每天向上跳 3 米但會滑下來 2 米，請問他第幾天能跳出井裡？

它再次翻車，答一個我們至今沒搞懂怎麼出來的 27 天。

而 new Bing 則是靠窮舉回答出這個問題。

就連大傢一直在嘲諷的文心一言，也完美解答這個問題。

說句實在話，我覺得起碼在這題裡，文心一言的表現，堪稱優雅。

至於寫代碼的能力，Google明確表示是寫不的。不過試一下，我發現 Bard 能寫，但完全沒法用，和之前的測試裡，能把 2048 遊戲寫個大概的 new Bing 不在一個水平線上。

大概，也就和文心一言同個梯隊，文心一言那個看著很詳細，但測試下也還是完全跑不動。

向下滑動

而且，經過一段時間測試，我們發現 Bard 的上下文記憶能力也很差。

每當我們賦予它一個角色，它隻能在有限的幾個問答裡玩角色扮演，稍微多問兩句，它就會跳出來說自己是大語言模型巴拉巴拉的。

也是這個原因，Google的 Bard 從沒有 GPT 帶給我的那種，仿佛真是在和一個真人聊天的感覺。

但，按Google自己的說法，這可是故意為之。

因為在官方資料裡，明確寫“ 是故意限制 Bard 掌握上下文的能力 ”，但大傢難免會懷疑Google是做不到而找個借口。

其實我們應該能感覺到，這次 Bard 的正式推出，Google方面明顯已經放低很多姿態。

上次面對的還是 ChatGPT，所以Google內部可能還抱有著短期內能追上掰掰手腕的想法。

所以，光是發佈個 PPT 就吹成“ 我們 AI 征程上的重要一步 ”。

但短短一個月，如今的對手已經從 ChatGPT 變成GPT-4 ，短時間內想追上可能無望。

所以這次正式推出 Bard 並不是一個沖著和 GPT-4 對標的產品，而且明顯有點趕工的跡象。

比如它在引用內容時，並不會像 new Bing 那樣總是顯示來源，隻有在詳盡地大段摘抄時，才會顯示來源。

而這次的標題，也成“ 試用 Bard 並分享你的反饋 ”。

無論咋說，從上面的表現中，差評君能看出Google確實有些屁股著火。

以至於在大夥們眼中一直很酷的Google，都開始草草交卷，急忙上線 Bard 這個不太成熟的半成品。

畢竟，在新技術的大浪之下，包括搜索引擎在內，一切都可能被重構。

而無論是雪藏數碼相機技術的柯達、還是在移動互聯網時代，舍不得和短信做割舍的飛信……

Google，也同科技史上那些處在變革時刻的巨頭們一樣，多半有些顧頭不顧腚。

畢竟，根據Google母公司的董事長的說法，大型語言模型等人工智能的對話成本可能是傳統搜索引擎的 10 倍以上。

一旦梭哈 AI ，那麼約等於是自己捅自己刀子，整個Google的盈利模式也得跟著改變。

乃至整個公司的估值，都得換個算法重新算算。

要是不跟，又妥妥會被新技術所淘汰。

沒有人能永遠保持創新，但永遠有人正在創新。這或許很殘酷，但這也是科技的魅力所在吧。

谷歌的“GPT”終於憋出來但也就和百度打得有來有回

相關推薦

14年微軟終於看到扳倒谷歌的“一絲希望”

OpenAI直播12天，馬斯克融資437 億

谷歌推Bard大戰ChatGPT 兩者有何不同？

谷歌發佈AI語言模型PaLM 2 與OpenAI旗下GPT-4等系統展開競爭

谷歌Gemini剛發就惹質疑：測試標準有失偏頗、效果視頻疑剪輯

李彥宏：百度文心一言和ChatGPT差距也就一兩個月

文心一言來 ChatGPT的壓力李彥宏接住嗎

體驗完百度的文心一言我隻能說：它膽子夠大

你都被ChatGPT白嫖，還得給它數錢

ChatGPT這兩天在內測的@功能要把谷歌和蘋果的生意都搶？

實測ChatGPT如何看待“競爭對手”谷歌的Bard

微軟狂飆，百度谷歌有點追不上

體驗微軟的ChatGPT後我覺得谷歌、百度麻煩

谷歌CEO皮查伊深度解析谷歌史上最強大模型Gemini及即將到來的人工智能時代

谷歌的“GPT”終於憋出來 但也就和百度打得有來有回

相關推薦

谷歌的“GPT”終於憋出來但也就和百度打得有來有回