谷歌的“GPT”終於憋出來 但也就和百度打得有來有回


不知道大傢還記不記得,上個月初Google畫個Bard的大餅,結果畫餅時犯低級錯誤,讓網友嘲諷半天,甚至公司股價都在當天狂跌1000多億。不過也不知道該說Google夠肝還是夠勇,在閉關修煉一個多月後,還是在昨晚正式放出Bard。


幸運的是,我們編輯部在第一時間就搞到資格,狠狠地體驗一波。

先說結論,有點失望

Bard 上來就讓我不爽一下。因為現階段它隻對美國和英國開放,所以和它對話隻能用英文,而且它的回復也隻能用英文。

不是,你守著個Google翻譯,也不舍得稍微用一下?哪怕告訴我這是機翻的也行……

明明自己吹牛說能理解翻譯回答包括中文在內的200多種語言


為表示對 AI 們的一視同仁,我一上來就問個弱智吧經典:

玉皇大帝應該住在平流層還是對流層?

Bard 看出我們在問題裡埋的坑,直接說玉皇大帝並不真實,所以兩個都不住。

這沒有什麼大毛病,和 GPT、文心一言們沒什麼差別。

但在後續的一系列測試裡,這應該是 Bard 回答得最好的一個問題。


更進一步,我們問個前幾天給 GPT 們測過的另一個抽象問題:

直角是 90 度,開水是 100 度,那麼開水是鈍角嗎?

結果這貨的小腦袋瓜宕機。


而文心一言的表現也一樣抽象……


相反,new Bing 回答得就有理有據。


接下來,我們讓它對比自己和 GPT-4。

“ 你能比較下自己和 GPT-4 嗎?”

Bard 和 GPT 不同,它一次能生成 3 個答案,大傢可以根據自己的需求去選擇。

而在這個問題下,Bard 的 3 個回答中,2 個大方承認自己比 GPT-4 落後,但還有 1 個回答避重就輕地嘴硬自己更強。

嘴硬麼也正常,但 Bard 的回答裡出現事實錯誤

其中一個回答裡,Bard 把已經發佈的 GPT-4 說成沒發佈;而在另一個回答裡,它把 GPT-3 使用的 1750 億參數套到 GPT-4 頭上,妥妥的胡說八道。

向下滑動



這就奇怪,Bard 明明是聯網的,數據怎麼會有問題呢?

為試試它數據扒得好不好,我把同樣聯網的 new Bing 也拉出來,問它們一個新鮮問題:

今天 NBA 常規賽,雷霆和快船誰贏( Who won the NBA Regular season between the Clippers and the Thunder today )。

但這裡有個雷點。英文提問可能會被誤解成 “ 今天雷霆和快船誰贏得常規賽冠軍 ”。

new Bing 就被我的錯誤提問繞暈,說自己不知道誰贏,但它又找到一些信息,裡面就有雷霆 101-100 戰勝快船的消息。


另一邊的 Bard 看起來好像是理解我的問題,還找到兩隊比分是 101-100,但它卻又偏偏說是快船以 100-101 贏得比賽

得要我指出它有錯誤,讓它重新檢查,它才改正過來。


數據是扒對,但這理解能力好像不太行。那不用聯網的數學題呢?

我們問一個經典的易錯題:

一個青蛙掉到一個 10 米深的井裡,它每天向上跳 3 米但會滑下來 2 米,請問他第幾天能跳出井裡?

它再次翻車,答一個我們至今沒搞懂怎麼出來的 27 天


而 new Bing 則是靠窮舉回答出這個問題。


就連大傢一直在嘲諷的文心一言,也完美解答這個問題。


說句實在話,我覺得起碼在這題裡,文心一言的表現,堪稱優雅

至於寫代碼的能力,Google明確表示是寫不的。不過試一下,我發現 Bard 能寫,但完全沒法用,和之前的測試裡, 能把 2048 遊戲寫個大概的 new Bing 不在一個水平線上 。

大概,也就和文心一言同個梯隊,文心一言那個看著很詳細,但測試下也還是完全跑不動。

向下滑動



而且,經過一段時間測試,我們發現 Bard 的上下文記憶能力也很差

每當我們賦予它一個角色,它隻能在有限的幾個問答裡玩角色扮演,稍微多問兩句,它就會跳出來說自己是大語言模型巴拉巴拉的。


也是這個原因,Google的 Bard 從沒有 GPT 帶給我的那種,仿佛真是在和一個真人聊天的感覺。

但,按Google自己的說法,這可是故意為之

因為在官方資料裡,明確寫“ 是故意限制 Bard 掌握上下文的能力 ”,但大傢難免會懷疑Google是做不到而找個借口。


其實我們應該能感覺到,這次 Bard 的正式推出,Google方面明顯已經放低很多姿態。

上次面對的還是 ChatGPT,所以Google內部可能還抱有著短期內能追上掰掰手腕的想法。

所以,光是發佈個 PPT 就吹成“ 我們 AI 征程上的重要一步 ”。


但短短一個月,如今的對手已經從 ChatGPT 變成GPT-4 ,短時間內想追上可能無望。

所以這次正式推出 Bard 並不是一個沖著和 GPT-4 對標的產品,而且明顯有點趕工的跡象。

比如它在引用內容時,並不會像 new Bing 那樣總是顯示來源,隻有在詳盡地大段摘抄時,才會顯示來源。

而這次的標題,也成“ 試用 Bard 並分享你的反饋 ”。


無論咋說,從上面的表現中,差評君能看出Google確實有些屁股著火。

以至於在大夥們眼中一直很酷的Google,都開始草草交卷,急忙上線 Bard 這個不太成熟的半成品。

畢竟,在新技術的大浪之下,包括搜索引擎在內,一切都可能被重構

而無論是雪藏數碼相機技術的柯達、還是在移動互聯網時代,舍不得和短信做割舍的飛信……

Google,也同科技史上那些處在變革時刻的巨頭們一樣,多半有些顧頭不顧腚。

畢竟,根據Google母公司的董事長的說法,大型語言模型等人工智能的對話成本可能是傳統搜索引擎的 10 倍以上。


一旦梭哈 AI ,那麼約等於是自己捅自己刀子,整個Google的盈利模式也得跟著改變。

乃至整個公司的估值,都得換個算法重新算算。

要是不跟,又妥妥會被新技術所淘汰。

沒有人能永遠保持創新,但永遠有人正在創新。這或許很殘酷,但這也是科技的魅力所在吧。


相關推薦

2023-02-08

自從2009年推出以來,微軟的必應搜索一直在“遙望”Google。但是這一次,微軟在人工智能(AI)身上看到一個扳倒Google的大好機會。周二,微軟宣佈將OpenAI的爆紅AI聊天機器人ChatGPT整合到必應搜索引擎中,這可能是該軟件巨頭首次

2023-02-09

技巨頭在AI領域都有新動作。眼看戰火要燒到自傢主場,谷歌也趕緊推出聊天機器人Bard,要與ChatGPT一較高下。同為聊天機器人,谷歌的Bard與微軟支持的ChatGPT具有相似之處,它們需要用戶鍵入一個問題或請求,以此做出回應。不

2023-05-11

5月11日消息,據外媒報道,當地時間周三,谷歌在谷歌I/O大會上發佈最新的人工智能(AI)語言模型PaLM 2,與OpenAI旗下的新一代大型語言模型GPT-4等系統展開競爭。2022年4月,谷歌首次發佈PaLM語言模型。PaLM 2在PaLM 1的基礎上進行

2023-12-07

谷歌憋許久的大招,雙子座Gemini大模型終於發佈!其中一圖一視頻最引人註目:一圖,MMLU多任務語言理解數據集測試,GeminiUltra不光超越GPT-4,甚至超越人類專傢。AI實時對人類的塗鴉和手勢動作給出評論和吐槽,流暢還很幽默

2023-03-27

子,今天大傢已經習慣GPT-4,GPT-4的技術跟我們隻差一天出來,是一個其他大廠也很難去拿出一個東西相比的技術。”李彥宏也承認,文心一言發佈之後遇到一些批評的聲音,這是在他預料之中的。他在發佈會上至少說過三遍,

2023-03-16

近5年,提前一個月宣傳造勢,備受關註的百度文心一言終於揭開神秘面紗。3月16日,百度基於文心大模型技術打造的生成式對話產品——文心一言正式亮相。據百度創始人、董事長兼CEO李彥宏介紹,文心一言在文學創作、商業

2023-03-17

但文心一言似乎陷入圈套,分析一堆可能導致貝多芬不出歌的原因。當然,測試 AI 智商肯定離不開數學題:請用 1 , 2 , 3 , 4 四個數字計算 24 點,每個數字隻能用一次。對於這個問題,一開始,文心一言似乎把自己的 CPU 幹燒。

2023-04-07

“谷歌計劃在旗艦搜索引擎中添加對話式人工智能功能,這將引導公司應對來自ChatGPT等聊天機器人的競爭和更廣泛的業務壓力。”谷歌首席執行官SundarPichai在近日的一次采訪中表示,AI並不會對谷歌的搜索業務構成威脅,相反,

2024-01-31

1月27日,OpenAI宣佈ChatGPT的新功能“GPTmentions”。目前,這個功能仍在內測中,尚不知道什麼時候會公開發佈。但已經有進入測試列表的網友在各種炫技。GPTmentions其實也比較好理解,就是一個@功能,每個月花20美金升級Plus的用戶

2023-02-08

當地時間周一,谷歌母公司Alphabet宣佈將推出名為Bard的人工智能聊天機器人技術,以此與OpenAI旗下的ChatGPT展開競爭。後者的爆紅令不少分析師警告稱,谷歌的核心產品,即在線搜索功能,恐面臨多年來最重大的風險,甚至遭遇

2023-02-20

夜之間,人們似乎都在期待,智能搜索引擎會怎樣幹掉以谷歌和百度為代表的傳統搜索引擎?ChatGPT火好一陣,各種消息還是層出不窮。有人讓它幫自己寫文案,有人在暢想什麼工作會被它取代,有人已經拿它當副業開始賺錢,

2023-02-09

ChatGPT又一次迎來不同意義上的爆紅。在淘寶上,開始出現大量店鋪售賣ChatGPT相關商品;在微信上,也湧現一大堆真假難辨的ChatGPT中轉機器人。ChatGPT也證明自己代替人類工作的可能,既可以通過Google的L3工程師面試,也能通過明

2023-12-07

12月7日消息,美國當地時間周三,谷歌發佈其新一代人工智能模型Gemini。Gemini反映谷歌內部多年來在首席執行官桑達爾·皮查伊(SundarPichai)的監督和推動下所做的努力。此前負責Chrome和安卓業務的皮查伊是出名的產品迷。2016年

2024-04-03

sp;“ 明智之舉 ” 。。。甚至有媒體直接拉出谷歌搜索引擎,說ChatGPT 要來取代它,還稱這會引起搜索市場的新一輪激戰。不過在世超看來, ChatGPT 這的這波操作,還真沒一些人吹得那麼有突破性,對於經