Google Bard大更新 我們用GPT-4給它出20道題


AI熱潮以來,“突發”就成我們標題的常客。昨天,來自Google的大語言生成類AI模型Bard又迎來更新,新增“Googleit”按鈕,增強數學與邏輯能力,並發佈一個全新的功能更新公告板。

發佈以來就飽受爭議的 Bard,如今能在數理邏輯領域,與 GPT-4 一較高下嗎?

01.三個更新點,做數學題是重點

為讓用戶更方便的解 Bard 更新變化,Google 上線 experiment updates(實驗更新)界面,展示 Bard 的最新消息。網址如下:

https://bard.google.com/updates


相比其他廠商“提高系統穩定性,優化系統流暢度”的更新對聯,Bard 不僅告訴你更新什麼,還告訴你為什麼更新。Google 表示,這是為讓用戶更快的進行測試、提供反饋。

順著更新公告往下看,“Google it”是這次的第一個功能更新,當你問過 Bard 後,可以在答案下方看到“Google it”的按鈕,點擊後 Bard 會生成幾個相關主題,以便你使用 Google 進行更多元的搜索。


這樣一來,Google 搜索就變成 Bard 的補充,如果在未來,Bard 完全替代前者我也不會感到意外。


不過,Google it 在提取復雜問題的主題時準確性還不夠高,比如在我詢問奧數題時,Google it 的主題幾乎沒有價值。



最後,也是最大的更新,Bard 的數學和邏輯能力得到升級,以前一道 123456*654321 就開始亂說的大語言模型終於站起身,開始實踐“學好數理化,走遍網絡都不怕”的道理。

光說不練假把式,Bard 的數理能力夠不夠強,我們給它出 20 道題,看看它的表現如何。

02.GPT-4 出 20 道題,Bard 滿分


第二題答案有誤,應為(2,-1)

我們用 GPT-4 整理 20 道數學、邏輯類問題,用於測試 Bard 的數理能力。


先不說對不對,Bard 的反應速度著實很快,即使是加速後的 GPT-3.5 也不是它的對手。



先來看看 Bard 的表現,Bard 不僅完全答對所有題目,還給出詳細的解題過程。

ChatGPT 的表現也不錯,數學題全對,邏輯題隻錯一個。

我們也把同樣的問題翻譯成中文去提問百度的文心一言和阿裡的通義千問,10 道數學題,通義千問僅對 1 題,文心一言則對 4 題;10 道邏輯判斷,通義千問 3 題正確略勝一籌,文心一言 2 題正確屈居第二。


不得不說,數理計算對大語言模型來說,門檻確實比較高。


10*3.14=314


無中生有的兔子

從我們簡短的測試來看,Bard 的表現相比它剛發佈時確實有顯著的提升,在回答問題的邏輯性和正確性上已經逐漸趕上 GPT-3.5。

比 ChatGPT 表現更好的是,Bard 在回答問題時還會加入引用信源,降低編造事實的可能。

目前 Google 對 Bard 的試用申請似乎放松不少,隻要申請加入 Waitlist 後再刷新幾次界面,就能馬上體驗 Bard。

感興趣的朋友可以在下方地址體驗。

https://bard.google.com/

如果你的試用申請一直都沒通過,也不用著急。

Google 的 CEO Sundar Pichai 最近在接受采訪時透露,Google 計劃將 Bard 整合到搜索引擎中,以應對 ChatGPT 等聊天機器人帶來的競爭壓力和更為廣泛的商業問題。

未來 Google 應該會像 Bing 那樣開放一個聊天搜索界面,直接在搜索引擎就能調用 Bard。

目前 Google 並沒有給出明確的時間表,也許在 5 月 10 日召開的 Google I/O 2023 大會上會透露出更多的信息。

AI 不會畫手、AI 不會做數學題,這些問題已經慢慢成為歷史,那麼問題來,AI 的下一個突破點,又會在哪裡呢?


相關推薦

2023-12-07

時候,整個AI行業都被重塑。Gemini技術報告:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf參考鏈接:[1]https://x.com/AravSrinivas/status/1732427844729581764[2]https://x.com/DimitrisPapail/status/1732529288493080600[3]https://www.linkedin.com/posts/svpino

2024-02-09

農歷春節除夕這一天,Google直接來一票大的:Bard今後統稱Gemini。通過GeminiAdvanced,即可訪問Google能力最強的原生多模態大模型GeminiUltra!去年12月,Google推出GeminiPro和GeminiNano,人們可以通過聊天機器人Bard、Pixel8Pro和三星S24系列手

2023-05-11

Bard全面增強、所有人可用……可以看出,這屆I/O大會,Google是真的憋出不少大招。GoogleI/O2023大會,仿佛又給Google的支持者們打一針強心劑。此前,因為微軟和OpenAI的優異表現,Google已經被唱衰很久。但是,畢竟是做出眾多奠基

2023-03-15

工智能”這個術語,全球迎來 AI 技術發展階段。在2016年GoogleDeepMind的“阿爾法狗”(AlphaGo)擊敗韓國圍棋冠軍李世乭,以及機器學習的誕生,AI 算法、算力、數據“三駕馬車”獲得突破性技術進展。但問題在於,機器學習利用

2023-03-23

不知道大傢還記不記得,上個月初Google畫個Bard的大餅,結果畫餅時犯低級錯誤,讓網友嘲諷半天,甚至公司股價都在當天狂跌1000多億。不過也不知道該說Google夠肝還是夠勇,在閉關修煉一個多月後,還是在昨晚正式放出Bard。幸

2023-03-22

AIGPT-4發佈、微軟將GPT-4接入Office全傢桶這樣一波碾壓後,Google也有新的動作!剛剛,Google宣佈正式公開發佈其聊天機器人產品Bard。Google表示此舉是為廣泛獲得來自用戶的反饋,以支持其在對話式生成模型賽道上與微軟競爭。據Go

2023-11-21

錯的,但說完全正確也無法讓人信服。至於具體的原因,我們繼續往下看。GPT-4準確率僅33%為評估人類和GPT-4在這些圖形題上的表現,研究者使用自傢機構於今年5月推出的ConceptARC數據集。ConceptARC中一共包括16個子類的圖形推理題

2023-04-24

幫你解釋代碼。雖然過去十幾年裡一直引領全球AI進步,Google在過去的幾個月卻隻能努力追趕微軟和OpenAI的步伐,為此這個星期甚至還把Google大腦和DeepMind合並到一起。去年底,ChatGPT 引發科技行業的劇變,今年 2 月,Google發佈 Ch

2023-12-07

時代變?迄今為止規模最大,能力最強的Google大模型來。當地時間12月6日,GoogleCEO桑達爾・皮查伊官宣Gemini1.0版正式上線。這次發佈的 Gemini 大模型是原生多模態大模型現在,Google的類 ChatGPT 應用 Bard 已經升級到 Gemini Pro 版本,

2023-04-07

文大模型研發。當時阿裡發佈的語言大模型StructBERT超越Google、微軟、Facebook,登頂CLUE榜單。2021年,阿裡先後發佈國內首個超百億參數多模態大模型M6,以及被稱為“中文版GPT-3”的語言大模型PLUG。其中,M6在多次迭代之後,實現

2023-11-01

”,它居然全都能夠讀懂。這些回答不靠聯網,純靠手動更新數據庫。隻能說,確實挺努力的。但不管更新多快,我們都沒法當聯網 AI 測試。隻能從基本能力入手,分別是語義理解、邏輯、多模態能力、文本生成、代碼這五個

2023-03-22

面對OpenAI和微軟的步步緊逼,Google終於不再坐以待斃。今日,Google宣佈正式開放旗下ChatGPT競爭對手Bard的公測,首先將面向美國和英國地區啟動。目前這兩個國傢的用戶都可以在bard.google.com上進行排隊等候,隨著測試的推進Bard也

2023-02-09

微軟與Google圍繞ChatGPT的這場龍爭虎鬥,以出人意料的方式揭開第一季的結局。北京時間2月8日晚間,Google在巴黎舉行AI發佈會,向外界正式披露聊天機器人產品Bard。作為ChatGPT最重要的挑戰者,Google過去兩周沒少為這場發佈造勢

2023-02-09

微軟與Google圍繞ChatGPT的這場龍爭虎鬥,以出人意料的方式揭開第一季的結局。北京時間2月8日晚間,Google在巴黎舉行AI發佈會,向外界正式披露聊天機器人產品Bard。作為ChatGPT最重要的挑戰者,Google過去兩周沒少為這場發佈造勢