Google Bard大更新我們用GPT-4給它出20道題

2023-04-13 來自 AppSo 發表於業界精選

AI熱潮以來，“突發”就成我們標題的常客。昨天，來自Google的大語言生成類AI模型Bard又迎來更新，新增“Googleit”按鈕，增強數學與邏輯能力，並發佈一個全新的功能更新公告板。

發佈以來就飽受爭議的 Bard，如今能在數理邏輯領域，與 GPT-4 一較高下嗎？

01.三個更新點，做數學題是重點

為讓用戶更方便的解 Bard 更新變化，Google 上線 experiment updates（實驗更新）界面，展示 Bard 的最新消息。網址如下：

https://bard.google.com/updates

相比其他廠商“提高系統穩定性，優化系統流暢度”的更新對聯，Bard 不僅告訴你更新什麼，還告訴你為什麼更新。Google 表示，這是為讓用戶更快的進行測試、提供反饋。

順著更新公告往下看，“Google it”是這次的第一個功能更新，當你問過 Bard 後，可以在答案下方看到“Google it”的按鈕，點擊後 Bard 會生成幾個相關主題，以便你使用 Google 進行更多元的搜索。

這樣一來，Google 搜索就變成 Bard 的補充，如果在未來，Bard 完全替代前者我也不會感到意外。

不過，Google it 在提取復雜問題的主題時準確性還不夠高，比如在我詢問奧數題時，Google it 的主題幾乎沒有價值。

最後，也是最大的更新，Bard 的數學和邏輯能力得到升級，以前一道 123456*654321 就開始亂說的大語言模型終於站起身，開始實踐“學好數理化，走遍網絡都不怕”的道理。

光說不練假把式，Bard 的數理能力夠不夠強，我們給它出 20 道題，看看它的表現如何。

02.GPT-4 出 20 道題，Bard 滿分

第二題答案有誤，應為（2,-1）

我們用 GPT-4 整理 20 道數學、邏輯類問題，用於測試 Bard 的數理能力。

先不說對不對，Bard 的反應速度著實很快，即使是加速後的 GPT-3.5 也不是它的對手。

先來看看 Bard 的表現，Bard 不僅完全答對所有題目，還給出詳細的解題過程。

ChatGPT 的表現也不錯，數學題全對，邏輯題隻錯一個。

我們也把同樣的問題翻譯成中文去提問百度的文心一言和阿裡的通義千問，10 道數學題，通義千問僅對 1 題，文心一言則對 4 題；10 道邏輯判斷，通義千問 3 題正確略勝一籌，文心一言 2 題正確屈居第二。

不得不說，數理計算對大語言模型來說，門檻確實比較高。

10*3.14=314

無中生有的兔子

從我們簡短的測試來看，Bard 的表現相比它剛發佈時確實有顯著的提升，在回答問題的邏輯性和正確性上已經逐漸趕上 GPT-3.5。

比 ChatGPT 表現更好的是，Bard 在回答問題時還會加入引用信源，降低編造事實的可能。

目前 Google 對 Bard 的試用申請似乎放松不少，隻要申請加入 Waitlist 後再刷新幾次界面，就能馬上體驗 Bard。

感興趣的朋友可以在下方地址體驗。

https://bard.google.com/

如果你的試用申請一直都沒通過，也不用著急。

Google 的 CEO Sundar Pichai 最近在接受采訪時透露，Google 計劃將 Bard 整合到搜索引擎中，以應對 ChatGPT 等聊天機器人帶來的競爭壓力和更為廣泛的商業問題。

未來 Google 應該會像 Bing 那樣開放一個聊天搜索界面，直接在搜索引擎就能調用 Bard。

目前 Google 並沒有給出明確的時間表，也許在 5 月 10 日召開的 Google I/O 2023 大會上會透露出更多的信息。

AI 不會畫手、AI 不會做數學題，這些問題已經慢慢成為歷史，那麼問題來，AI 的下一個突破點，又會在哪裡呢？

相關推薦

谷歌Gemini剛發就惹質疑：測試標準有失偏頗、效果視頻疑剪輯

2023-12-07

時候，整個AI行業都被重塑。Gemini技術報告：https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf參考鏈接：[1]https://x.com/AravSrinivas/status/1732427844729581764[2]https://x.com/DimitrisPapail/status/1732529288493080600[3]https://www.linkedin.com/posts/svpino

Google Bard大更新我們用GPT-4給它出20道題

相關推薦

谷歌Gemini剛發就惹質疑：測試標準有失偏頗、效果視頻疑剪輯

Gemini Ultra每月19.9刀，前兩月免費網友實測：GPT-4不香

谷歌一雪前恥全新PaLM 2反超GPT-4 Bard史詩進化

最新GPT-4在律考中擊敗90%人類，它到底強在哪？

谷歌的“GPT”終於憋出來但也就和百度打得有來有回

Google版ChatGPT Bard開放測試我們已經體驗上

GPT-4不會圖形推理？“放水”後準確率依然隻有33%

支持20種編程語言谷歌版ChatGPT代碼水平反殺？

超越GPT4！谷歌大殺器終於來最大規模Gemini震撼發佈

阿裡版ChatGPT突然上線邀測大模型熱戰正劇開始

上手通義千問2.0後我才發現大模型的天敵是伍佰

對抗ChatGPT：谷歌Bard公測炸場巨頭開啟AI對決

擁有一切的谷歌輸掉ChatGPT首戰

擁有一切的谷歌輸掉ChatGPT首戰

Google Bard大更新 我們用GPT-4給它出20道題

相關推薦

Google Bard大更新我們用GPT-4給它出20道題