谷歌一雪前恥全新PaLM 2反超GPT-4 Bard史詩進化

2023-05-11 來自新智元發表於業界精選

新版PaLM2超強進化，辦公全傢桶Workspace全面升級，Bard全面增強、所有人可用……可以看出，這屆I/O大會，Google是真的憋出不少大招。GoogleI/O2023大會，仿佛又給Google的支持者們打一針強心劑。

此前，因為微軟和OpenAI的優異表現，Google已經被唱衰很久。

但是，畢竟是做出眾多奠基性工作的AI老牌公司，Google這一輪的發力，讓我們精神一振——它隻是慢，並不是噶。

對打GPT-4的PaLM 2登臺、Duet AI整進Google辦公全傢桶Workspace、Bard超強進化向所有人開放、Google搜索加入AI快照、AI新功能整合進Android 14、AI魔術編輯器加入Google相冊等等。

這屆I/O大會，可謂眼花繚亂，精彩紛呈。

PALM 2秀肌肉，手機也能跑

OpenAI的GPT-4，已經被全世界公認為最強大的語言模型。

怎麼對打GPT-4？Google的答案，就是PaLM 2。

恰在今天，Google一同發佈PaLM 2技術報告。

論文地址：https://ai.google/static/documents/palm2techreport.pdf

顯然，PaLM2被寄予厚望，以縮小Google和微軟之間在AI方面的差距。

劈柴介紹說，因為廣泛的邏輯和推理訓練，PaLM 2模型在邏輯和推理方面更加強大。據說，PaLM 2在超過100多種語言的多語言文本上進行訓練。

根據基準測試，對於具有思維鏈prompt或自洽性的MATH、GSM8K和MGSM基準評估，PaLM 2的部分結果超越GPT-4。

據Google高級研究主管Slav Petrov介紹，PaLM 2在推理、編碼和翻譯上都表現更好，與2022年4月發佈的第一代PaLM相比，PaLM 2有明顯的改進。

可以看到，PaLM 2的推理能力，得到顯著的改進

修改代碼bug後，用韓語評論。

比如，PaLM 2能夠理解不同語言的成語。

比起PaLM，在最新專業語言熟練度考試中的表現，PaLM 2的日語水平達到A級，而PaLM達到F級。PaLM 2的法語水平達到C1級。

德語“Ich verstehe nur Bahnhof”如果直譯，就是“我隻理解火車站”，但如果你問它，你是不是理解錯誤？

它馬上就會告訴你，沒錯，這個德語的意思是“你說的啥？我什麼都聽不懂”。

再比如，和波斯諺語“Na borde ranj ganj moyassar nemishavad”（No Pain, No Gain）意思相近的中文諺語是什麼？

在相關論文中，Google工程師聲稱PaLM 2的語言能力已經“足以教授這門語言”，原因是其訓練數據中的非英語文本更為普遍。

PaLM 2包含4個不同參數的模型，包括壁虎（Gecko）、水獺（Otter）、野牛（Bison）和獨角獸（Unicorn），並在特定領域的數據上進行微調，為企業客戶執行某些任務。

這些微調就像給一個卡車底盤，加上一個新的發動機或前保險杠，以在某些特定任務上更好地工作。

這樣的優勢不言而喻，不用花費大量的時間和資源來創建，直接部署。

另外，PaLM2有一個基於健康數據訓練的版本Med-PaLM 2，可以輕松通過美國醫學執照考試，達到“專傢”水平。

一個基於網絡安全數據訓練的版本Sec-PaLM 2，可以解釋潛在惡意腳本的行為，檢測到代碼中的威脅。這兩種模型都將通過Google雲提供給特定客戶。

目前，PaLM 2已經應用在25種功能和產品中，包括辦公全傢桶、聊天機器人Bard、搜索等等。

值得稱贊的是，PaLM 2最輕量版本Gecko小到可以在手機上運行，每秒可以處理20個token，大約每秒16或17個單詞。

不過，Google沒有提及具體用什麼硬件來測試這個模型，隻是說在“最新的手機上”運行。

顯然，這次Google在大語言模型的小型化上，取得非常重要的進步。在雲端運行這種AI，往往是很昂貴的，如果能在本地運行，無疑有著許多顯著優勢，比如隱私保護。

英偉達科學傢Jim Fan對此大加贊許——

下一波LLM將是移動原生的。一個離線的、永遠在線的LLM不僅可以降低服務成本，而且還為用戶體驗開辟全新的途徑。例如，一個元應用程序可以從你的移動工作流程中學習，並為你實現自動化。在小屏幕上節省的生產力，將比在大屏幕上多得多。

此前，Google一直被嘲在AI研究上已經落後於微軟，PaLM 2，無疑是Google的一次重大回擊。

但PaLM 2同樣也面臨著一些爭議，比如訓練語言模型的數據是否合法？

Google隻是提到訓練語料庫來自“網絡文檔、書籍、代碼、數學和對話數據”，但並沒有進一步的細節。

而大語言模型的幻覺問題，同樣無法避免。Google研究副總裁Zoubin Ghahramani表示，PaLM 2是對早期模型的改進，Google“投入大量精力，不斷改進基礎性和歸因指標”。

但他承認，在打擊AI產生的虛假信息方面，大傢都還有很長的路要走。

除PALM 2，Google還宣佈正在訓練的全新基礎模型Gemini。這是第一個多模態模型，同樣包含參數大小不同的模型。

除介紹模型，Google還特地介紹開發 AI 技術的社會責任感，包括兩個判別AI生成內容的工具：

- watermarking（嵌入水印）

- metADATA（嵌入元數據）

Duet AI：辦公全傢桶新升級

此前，微軟Copilot把GPT-4整進全系辦公產品，掀起震驚全世界的辦公軟件革命。

怎麼破？Google這次祭出Duet AI，給Google辦公全傢桶Workspace來一個全新升級。

其實呢，這也就是新瓶裝舊酒，Duet AI就是Docs和Gmail等軟件中AI工具的新名字。

Google希望，生成式AI能讓Gmail、Docs、Sheets和Slides更有用，不過目前，大部分功能還在開發中。

Duet AI會涵蓋Google的各種辦公軟件，包括在文檔和Gmail中的寫作輔助、幻燈片的圖片生成、Meet的自動會議摘要等等。

在文檔中，隻要點“Help me write”，Duet AI就能自動幫你生成招聘啟事。

好玩的是，你還可以規定任意文風，比如讓它古怪的調調寫出一個工作描述。

在Google Slids中，Duet AI能直接從幻燈片中的文本生成圖像。

簡單描述一下，合意的圖片立馬生成。

想做一個遛狗業務的收費表？描述一下，它就給你自動生成。

而I/O大會上一個真正的新事兒是，寫作輔助也會應用在移動端的Gmail上，這是對Smart Compose的升級。

現在，如果想試用這些新工具，需要註冊Workspace Labs，加入候補名單。

好消息是，現在任何人都可以申請加入候補名單，不過目前尚不清楚用戶何時可以訪問。Google的說法是，將在未來幾周內將服務擴展到“更多的用戶和國傢”。

目前唯一可靠的消息是，Gmail的移動程序上會出現“Help me write”AI助手，此前微軟也曾推出類似產品，將必應集成到iOS和Android的SwiftKey鍵盤中。

Bard又雙叒叕便強

發佈會上，Google還宣佈一個重磅消息。

那就是，Bard未來也能像ChatGPT一樣，接入網絡，實時搜索網頁。

這次，Bard上新不少功能，比如支持兩種新的語言——日語和韓語，用戶目前可以更簡便地把生成的文本導出到Google文檔和Gmail，可視化搜索，以及深色模式等等。

不過，最令用戶開心的，想必是Google決定取消Bard的等候名單——將在180個國傢或地區提供服務。

此外，和Adobe的AI圖像生成功能，以及Instacart和OpenTable等第三方服務的功能整合也正在路上。

總的來看，這些上新是給老Bard註入的一針強心劑。

目前，Google正在使Bard變得更加可視化，讓Bard能夠分析圖像，並且能在查詢結果中提供圖像信息等等。

關於這一方面，Google在發佈會上展示一個案例。

假如用戶問Bard，美國的新奧爾良有哪些必看的景點，那麼Bard就能圖文並茂的解答這個問題。

就像用戶在Google搜圖中問同樣的問題一樣。

你還可以，用Bard起草郵件，並一鍵導入Gmail，還有文檔中。

而另一個更好玩兒的功能是用圖像提示系統。該功能由Google Lens提供，它能夠識別圖片中的物體。

比方說，上傳一張狗狗的照片，然後給一個prompt“為這兩隻狗寫編一個有趣的標題”。Google Lens就可以識別狗狗的品種，然後Bard就能寫下與這兩隻狗狗特征相關的內容。

該功能目前可能還不太完善，雖說潛力無限。未來如何取決於系統的整合程度。

雖說對Bard來講，這是一個相當重大的更新，但和OpenAI的ChatGPT，以及微軟的Bing之間的差距仍然是肉眼可見的。

要知道，微軟在3月就給Bing增加由OpenAI的DALL-E系統支持的AI圖像生成功能。而OpenAI和微軟一直在探索如何將聊天機器人與更多種的網絡服務相結合。

不僅如此，OpenAI早些時候還宣佈ChatGPT將和OpenTable預訂餐廳，以及Instacart訂貨配送的功能相結合。

Google表示，這些功能自己之後也會有的。

代碼能力up

Google表示，升級後的Bard將會非常擅長處理有關代碼的問題，包括調試和解釋20多種語言的代碼。

因此，今天發佈會上的一些升級主要集中在這個方面上。

包括新的深色模式，改進的代碼引用功能——不僅能提供來源，還能解釋代碼片段，以及一個新的導出功能。

用戶可以把代碼發送到Google的Colab平臺，還能和另一個基於瀏覽器的IDE——Replit一起使用（從Python查詢開始）。

隻要選中代碼，就可以一鍵導出到Colab或者Replit。

還支持20+種編程語言。基本涵蓋碼農們所需的所有編程需要。

甚至還能直接詢問Bard怎麼用某一種語言實現某種功能。隻要prompt到位，生成一串代碼也就是幾秒鐘的事。

寫完以後，還能就著某一行代碼進行解釋，以及完善。

如此看來，結合PaLM2的Bard應該會在生成質量上有明顯的提升。當然，具體表現如何，還得再觀察。

對戰必應，GoogleAI搜索已來

此前，整合進GPT的必應勢如破竹，真正威脅到Google的搜索市場。

為與微軟必應競爭，Google同在今天推出由PaLM 2驅動的全新搜索引擎。

它能夠提供問題回答的摘要，比如問“為什麼酵母面包仍然如此受歡迎？”，Google搜索就給出幾段詳細描述酵母的味道、其益生元能力的優勢等等。

另外，在生成內容旁，給出3個鏈接，以證明摘要中的內容。這樣以減少AI在生成內容上出現“幻覺”問題。

當你搜索藍牙音箱，首先頂部有一個簡短的摘要，詳細說明購買時應註意的事項：電池壽命、防水性、音質。

右邊是三個購買指南的鏈接，下面是6個不錯選擇的購物鏈接，每個旁邊都有一個 AI 生成的摘要。

可以看到，這是Google搜索結果頁面的new look。把AI生成內容放在最開始。

比起重新設計的微軟必應，搜索結果頂部的AI框對Google來說更像是，一個小小的更新。

值得註意的是，要是想要訪問這一功能，你必須選擇Search Generative Experience（SGE）這一新功能。

並非所有搜索都會有AI生成的答案。隻有當Google的算法認為它比標準答案更有用時，AI內容才會出現，而像健康、財務等敏感主題完全不會有AI生成。

Google表示，其改進後的搜索引擎能夠以對話方式跟蹤原始搜索查詢的選項，無需重復已經提供的上下文或細節。

然而，Google搜索也不是無所不能，也存在從未完全解決過的問題——結構編排（orchestration of structure）。

因為大部分數據儲存在互聯網上，甚至Google內部，但將所有這些數據放在一起形成一個連貫的答案真的很難。

目前，已經開放候補名單僅限美國，Google表示，未來幾個月將考慮更廣泛地推出這一功能。

一鍵退款，智能P圖，沉浸導航

一鍵生成退款郵件？

Google行。

劈柴在發佈會一開始就整個小活。航班取消得退款？不會寫申請退款的郵件？

gmail會。

隻要在prompt欄裡輸入要求，gmail分分鐘生成一篇有理有據有節的退款申請郵件。

另外，GoogleMap現在也有沉浸式view，你想去哪，懟臉的實景導航來。

你還能順便問問空氣質量、天氣、交通狀況，都能即時演示。

Magic Editor是Google最新公佈的照片處理功能，使用生成性AI，可以讓用戶在沒有專業工具的情況下對照片進行各種編輯。

不會p圖星人的福音來？

發佈會上，Google分享幾個應用這項新功能的案例，不得不說，效果酷炸。

比如下面這張，Magic Editor一鍵把瀑佈前的人像挪到側面，還把背景中別的遊客p掉。不僅如此，本來多雲的天氣硬是給p藍。

再比如下面這張，Magic Editor一鍵將長凳上的小孩連著凳子一起移到中間，自動補齊多出來的椅子，還把原畫中缺失的氣球補齊。

而且天也p藍。

當然，這項功能還沒到最完美的地步。就比方說，仔細看看上面這張圖片，凳子挪動，可是底下的影子沒動。

但總歸，這項功能對照片本身的理解是革命性的。

當然，咱現在還不用太擔心是不是有的圖片被Magic Editor處理過。因為Google說，下半年才會推出這項功能。

AI筆記本Project Tailwind

學生黨福音來。

不得不說，Google還真把學生們拿捏住。

Project Tailwind從本質上講，就是個筆記本，但是加AI的能力。

一下子就不一樣。

用戶可以像問導師或者學習搭子一樣進行在Tailwind裡進行檢索。

雖說Google把這個功能其定位為學生服務的工具，但是對於日常需要處理大量文本的打工人來說，也是重大利好。

Google產品管理高級總監表示，Tailwind就像一個真正的筆記本一樣，你在裡面記東西，而這些內容就是AI學習的對象。

用戶可以簡便地從Google雲端硬盤中挑選文件，有效創建一個兼具個性化和私人屬性的AI模型。

目前，該功能在大學校園內進行廣泛的測試。

在示例演示中，Tailwind收集一大堆學習筆記，然後，生成包括主題詞在內的很多內容，比如，用戶可以為特定主題創建術語表。

Tailwind不僅僅能為學生服務，它對任何從不同來源獲取信息的人都有幫助。

隱藏在Tailwind背後的理念是，為什麼我們不能為每個用戶定制不同的AI語言模型呢？

當然，這裡存在兩個問題。

一方面是成本問題。訓練語言模型所需的計算需求和微調成本都很高，誰來負擔這個成本？另一方面則是信息安全性。

畢竟，捏造信息這種事可一點都不稀奇，誰能保證個性化的筆記本不會出現同樣的問題呢。

不過，是騾子是馬還得拉出來遛遛。用戶目前可以註冊Project Tailwind進行測試。該功能也是AI Labs計劃的一部分。

Android開發小助手

此外，GoogleI/O大會上還推出專為Android開發的AI編碼機器人Studio Bot。

不僅可以生成代碼、修復BUG，甚至能夠回答關於Android應用開發的相關問題。

同時支持Kotlin和Java編程語言，並將直接嵌入到Android Studio開發工具的工具欄中。

谷歌一雪前恥全新PaLM 2反超GPT-4 Bard史詩進化

相關推薦

一雪前恥！iPhone 15 Pro邊框破紀錄

“我們有更強大的語言模型” Google CEO稱將推出Bard升級版

谷歌深夜放復仇殺器Gemini：最強原生多模態史詩級碾壓GPT-4 語言理解首超人類

15年前上“FFmpeg 恥辱柱” 今天他卻得謝謝咱：騰訊QQ影音一雪前恥？

對抗ChatGPT：谷歌Bard公測炸場巨頭開啟AI對決

2023谷歌I/O大會：AI接管谷歌搜索 Pixel Fold折疊屏來

谷歌發佈AI語言模型PaLM 2 與OpenAI旗下GPT-4等系統展開競爭

人工智能軍備競賽白熱化：谷歌最新AI大語言模型數據量擴充5倍

谷歌發佈AI語言模型PaLM 2 挑戰OpenAI的GPT-4

兩個小時：谷歌說143次AI 股價連漲兩天

王炸更新！谷歌發佈PaLM 2大模型：支持100種語言

谷歌Gemini剛發就惹質疑：測試標準有失偏頗、效果視頻疑剪輯

ChatGPT陰影之下的谷歌Bard實測：珠玉在前

谷歌將其人工智能聊天機器人bard升級為palm 2語言模型

谷歌一雪前恥 全新PaLM 2反超GPT-4 Bard史詩進化

相關推薦

谷歌一雪前恥全新PaLM 2反超GPT-4 Bard史詩進化