AI熱潮以來,“突發”就成我們標題的常客。昨天,來自Google的大語言生成類AI模型Bard又迎來更新,新增“Googleit”按鈕,增強數學與邏輯能力,並發佈一個全新的功能更新公告板。
發佈以來就飽受爭議的 Bard,如今能在數理邏輯領域,與 GPT-4 一較高下嗎?
01.三個更新點,做數學題是重點
為讓用戶更方便的解 Bard 更新變化,Google 上線 experiment updates(實驗更新)界面,展示 Bard 的最新消息。網址如下:
https://bard.google.com/updates
相比其他廠商“提高系統穩定性,優化系統流暢度”的更新對聯,Bard 不僅告訴你更新什麼,還告訴你為什麼更新。Google 表示,這是為讓用戶更快的進行測試、提供反饋。
順著更新公告往下看,“Google it”是這次的第一個功能更新,當你問過 Bard 後,可以在答案下方看到“Google it”的按鈕,點擊後 Bard 會生成幾個相關主題,以便你使用 Google 進行更多元的搜索。
這樣一來,Google 搜索就變成 Bard 的補充,如果在未來,Bard 完全替代前者我也不會感到意外。
不過,Google it 在提取復雜問題的主題時準確性還不夠高,比如在我詢問奧數題時,Google it 的主題幾乎沒有價值。
最後,也是最大的更新,Bard 的數學和邏輯能力得到升級,以前一道 123456*654321 就開始亂說的大語言模型終於站起身,開始實踐“學好數理化,走遍網絡都不怕”的道理。
光說不練假把式,Bard 的數理能力夠不夠強,我們給它出 20 道題,看看它的表現如何。
02.GPT-4 出 20 道題,Bard 滿分
第二題答案有誤,應為(2,-1)
我們用 GPT-4 整理 20 道數學、邏輯類問題,用於測試 Bard 的數理能力。
先不說對不對,Bard 的反應速度著實很快,即使是加速後的 GPT-3.5 也不是它的對手。
先來看看 Bard 的表現,Bard 不僅完全答對所有題目,還給出詳細的解題過程。
ChatGPT 的表現也不錯,數學題全對,邏輯題隻錯一個。
我們也把同樣的問題翻譯成中文去提問百度的文心一言和阿裡的通義千問,10 道數學題,通義千問僅對 1 題,文心一言則對 4 題;10 道邏輯判斷,通義千問 3 題正確略勝一籌,文心一言 2 題正確屈居第二。
不得不說,數理計算對大語言模型來說,門檻確實比較高。
10*3.14=314
無中生有的兔子
從我們簡短的測試來看,Bard 的表現相比它剛發佈時確實有顯著的提升,在回答問題的邏輯性和正確性上已經逐漸趕上 GPT-3.5。
比 ChatGPT 表現更好的是,Bard 在回答問題時還會加入引用信源,降低編造事實的可能。
目前 Google 對 Bard 的試用申請似乎放松不少,隻要申請加入 Waitlist 後再刷新幾次界面,就能馬上體驗 Bard。
感興趣的朋友可以在下方地址體驗。
https://bard.google.com/
如果你的試用申請一直都沒通過,也不用著急。
Google 的 CEO Sundar Pichai 最近在接受采訪時透露,Google 計劃將 Bard 整合到搜索引擎中,以應對 ChatGPT 等聊天機器人帶來的競爭壓力和更為廣泛的商業問題。
未來 Google 應該會像 Bing 那樣開放一個聊天搜索界面,直接在搜索引擎就能調用 Bard。
目前 Google 並沒有給出明確的時間表,也許在 5 月 10 日召開的 Google I/O 2023 大會上會透露出更多的信息。
AI 不會畫手、AI 不會做數學題,這些問題已經慢慢成為歷史,那麼問題來,AI 的下一個突破點,又會在哪裡呢?