谷歌一雪前恥 全新PaLM 2反超GPT-4 Bard史詩進化


新版PaLM2超強進化,辦公全傢桶Workspace全面升級,Bard全面增強、所有人可用……可以看出,這屆I/O大會,Google是真的憋出不少大招。GoogleI/O2023大會,仿佛又給Google的支持者們打一針強心劑。


此前,因為微軟和OpenAI的優異表現,Google已經被唱衰很久。

但是,畢竟是做出眾多奠基性工作的AI老牌公司,Google這一輪的發力,讓我們精神一振——它隻是慢,並不是噶。


對打GPT-4的PaLM 2登臺、Duet AI整進Google辦公全傢桶Workspace、Bard超強進化向所有人開放、Google搜索加入AI快照、AI新功能整合進Android 14、AI魔術編輯器加入Google相冊等等。

這屆I/O大會,可謂眼花繚亂,精彩紛呈。

PALM 2秀肌肉,手機也能跑

OpenAI的GPT-4,已經被全世界公認為最強大的語言模型。

怎麼對打GPT-4?Google的答案,就是PaLM 2。

恰在今天,Google一同發佈PaLM 2技術報告。


論文地址:https://ai.google/static/documents/palm2techreport.pdf

顯然,PaLM2被寄予厚望,以縮小Google和微軟之間在AI方面的差距。

劈柴介紹說,因為廣泛的邏輯和推理訓練,PaLM 2模型在邏輯和推理方面更加強大。據說,PaLM 2在超過100多種語言的多語言文本上進行訓練。

根據基準測試,對於具有思維鏈prompt或自洽性的MATH、GSM8K和MGSM基準評估,PaLM 2的部分結果超越GPT-4。


據Google高級研究主管Slav Petrov介紹,PaLM 2在推理、編碼和翻譯上都表現更好,與2022年4月發佈的第一代PaLM相比,PaLM 2有明顯的改進。


可以看到,PaLM 2的推理能力,得到顯著的改進

修改代碼bug後,用韓語評論。


比如,PaLM 2能夠理解不同語言的成語。

比起PaLM,在最新專業語言熟練度考試中的表現,PaLM 2的日語水平達到A級,而PaLM達到F級。PaLM 2的法語水平達到C1級。


德語“Ich verstehe nur Bahnhof”如果直譯,就是“我隻理解火車站”,但如果你問它,你是不是理解錯誤?

它馬上就會告訴你,沒錯,這個德語的意思是“你說的啥?我什麼都聽不懂”。


再比如,和波斯諺語“Na borde ranj ganj moyassar nemishavad”(No Pain, No Gain)意思相近的中文諺語是什麼?


在相關論文中,Google工程師聲稱PaLM 2的語言能力已經“足以教授這門語言”,原因是其訓練數據中的非英語文本更為普遍。

PaLM 2包含4個不同參數的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn),並在特定領域的數據上進行微調,為企業客戶執行某些任務。


這些微調就像給一個卡車底盤,加上一個新的發動機或前保險杠,以在某些特定任務上更好地工作。

這樣的優勢不言而喻,不用花費大量的時間和資源來創建,直接部署。

另外,PaLM2有一個基於健康數據訓練的版本Med-PaLM 2,可以輕松通過美國醫學執照考試,達到“專傢”水平。


一個基於網絡安全數據訓練的版本Sec-PaLM 2,可以解釋潛在惡意腳本的行為,檢測到代碼中的威脅。這兩種模型都將通過Google雲提供給特定客戶。

目前,PaLM 2已經應用在25種功能和產品中,包括辦公全傢桶、聊天機器人Bard、搜索等等。

值得稱贊的是,PaLM 2最輕量版本Gecko小到可以在手機上運行,每秒可以處理20個token,大約每秒16或17個單詞。

不過,Google沒有提及具體用什麼硬件來測試這個模型,隻是說在“最新的手機上”運行。


顯然,這次Google在大語言模型的小型化上,取得非常重要的進步。在雲端運行這種AI,往往是很昂貴的,如果能在本地運行,無疑有著許多顯著優勢,比如隱私保護。

英偉達科學傢Jim Fan對此大加贊許——

下一波LLM將是移動原生的。一個離線的、永遠在線的LLM不僅可以降低服務成本,而且還為用戶體驗開辟全新的途徑。例如,一個元應用程序可以從你的移動工作流程中學習,並為你實現自動化。在小屏幕上節省的生產力,將比在大屏幕上多得多。


此前,Google一直被嘲在AI研究上已經落後於微軟,PaLM 2,無疑是Google的一次重大回擊。

但PaLM 2同樣也面臨著一些爭議,比如訓練語言模型的數據是否合法?

Google隻是提到訓練語料庫來自“網絡文檔、書籍、代碼、數學和對話數據”,但並沒有進一步的細節。

而大語言模型的幻覺問題,同樣無法避免。Google研究副總裁Zoubin Ghahramani表示,PaLM 2是對早期模型的改進,Google“投入大量精力,不斷改進基礎性和歸因指標”。

但他承認,在打擊AI產生的虛假信息方面,大傢都還有很長的路要走。

除PALM 2,Google還宣佈正在訓練的全新基礎模型Gemini。這是第一個多模態模型,同樣包含參數大小不同的模型。


除介紹模型,Google還特地介紹開發 AI 技術的社會責任感,包括兩個判別AI生成內容的工具:

- watermarking(嵌入水印)

- metADATA(嵌入元數據)


Duet AI:辦公全傢桶新升級

此前,微軟Copilot把GPT-4整進全系辦公產品,掀起震驚全世界的辦公軟件革命。

怎麼破?Google這次祭出Duet AI,給Google辦公全傢桶Workspace來一個全新升級。


其實呢,這也就是新瓶裝舊酒,Duet AI就是Docs和Gmail等軟件中AI工具的新名字。

Google希望,生成式AI能讓Gmail、Docs、Sheets和Slides更有用,不過目前,大部分功能還在開發中。

Duet AI會涵蓋Google的各種辦公軟件,包括在文檔和Gmail中的寫作輔助、幻燈片的圖片生成、Meet的自動會議摘要等等。

在文檔中,隻要點“Help me write”,Duet AI就能自動幫你生成招聘啟事。


好玩的是,你還可以規定任意文風,比如讓它古怪的調調寫出一個工作描述。


在Google Slids中,Duet AI能直接從幻燈片中的文本生成圖像。


簡單描述一下,合意的圖片立馬生成。


想做一個遛狗業務的收費表?描述一下,它就給你自動生成。


而I/O大會上一個真正的新事兒是,寫作輔助也會應用在移動端的Gmail上,這是對Smart Compose的升級。

現在,如果想試用這些新工具,需要註冊Workspace Labs,加入候補名單。

好消息是,現在任何人都可以申請加入候補名單,不過目前尚不清楚用戶何時可以訪問。Google的說法是,將在未來幾周內將服務擴展到“更多的用戶和國傢”。

目前唯一可靠的消息是,Gmail的移動程序上會出現“Help me write”AI助手,此前微軟也曾推出類似產品,將必應集成到iOS和Android的SwiftKey鍵盤中。

Bard又雙叒叕便強

發佈會上,Google還宣佈一個重磅消息。

那就是,Bard未來也能像ChatGPT一樣,接入網絡,實時搜索網頁。

這次,Bard上新不少功能,比如支持兩種新的語言——日語和韓語,用戶目前可以更簡便地把生成的文本導出到Google文檔和Gmail,可視化搜索,以及深色模式等等。


不過,最令用戶開心的,想必是Google決定取消Bard的等候名單——將在180個國傢或地區提供服務。


此外,和Adobe的AI圖像生成功能,以及Instacart和OpenTable等第三方服務的功能整合也正在路上。

總的來看,這些上新是給老Bard註入的一針強心劑。


目前,Google正在使Bard變得更加可視化,讓Bard能夠分析圖像,並且能在查詢結果中提供圖像信息等等。

關於這一方面,Google在發佈會上展示一個案例。

假如用戶問Bard,美國的新奧爾良有哪些必看的景點,那麼Bard就能圖文並茂的解答這個問題。

就像用戶在Google搜圖中問同樣的問題一樣。


你還可以,用Bard起草郵件,並一鍵導入Gmail,還有文檔中。


而另一個更好玩兒的功能是用圖像提示系統。該功能由Google Lens提供,它能夠識別圖片中的物體。

比方說,上傳一張狗狗的照片,然後給一個prompt“為這兩隻狗寫編一個有趣的標題”。Google Lens就可以識別狗狗的品種,然後Bard就能寫下與這兩隻狗狗特征相關的內容。


該功能目前可能還不太完善,雖說潛力無限。未來如何取決於系統的整合程度。

雖說對Bard來講,這是一個相當重大的更新,但和OpenAI的ChatGPT,以及微軟的Bing之間的差距仍然是肉眼可見的。

要知道,微軟在3月就給Bing增加由OpenAI的DALL-E系統支持的AI圖像生成功能。而OpenAI和微軟一直在探索如何將聊天機器人與更多種的網絡服務相結合。

不僅如此,OpenAI早些時候還宣佈ChatGPT將和OpenTable預訂餐廳,以及Instacart訂貨配送的功能相結合。

Google表示,這些功能自己之後也會有的。

代碼能力up

Google表示,升級後的Bard將會非常擅長處理有關代碼的問題,包括調試和解釋20多種語言的代碼。

因此,今天發佈會上的一些升級主要集中在這個方面上。

包括新的深色模式,改進的代碼引用功能——不僅能提供來源,還能解釋代碼片段,以及一個新的導出功能。

用戶可以把代碼發送到Google的Colab平臺,還能和另一個基於瀏覽器的IDE——Replit一起使用(從Python查詢開始)。


隻要選中代碼,就可以一鍵導出到Colab或者Replit。


還支持20+種編程語言。基本涵蓋碼農們所需的所有編程需要。


甚至還能直接詢問Bard怎麼用某一種語言實現某種功能。隻要prompt到位,生成一串代碼也就是幾秒鐘的事。


寫完以後,還能就著某一行代碼進行解釋,以及完善。


如此看來,結合PaLM2的Bard應該會在生成質量上有明顯的提升。當然,具體表現如何,還得再觀察。

對戰必應,GoogleAI搜索已來

此前,整合進GPT的必應勢如破竹,真正威脅到Google的搜索市場。

為與微軟必應競爭,Google同在今天推出由PaLM 2驅動的全新搜索引擎。


它能夠提供問題回答的摘要,比如問“為什麼酵母面包仍然如此受歡迎?”,Google搜索就給出幾段詳細描述酵母的味道、其益生元能力的優勢等等。

另外,在生成內容旁,給出3個鏈接,以證明摘要中的內容。這樣以減少AI在生成內容上出現“幻覺”問題。


當你搜索藍牙音箱,首先頂部有一個簡短的摘要,詳細說明購買時應註意的事項:電池壽命、防水性、音質。

右邊是三個購買指南的鏈接,下面是6個不錯選擇的購物鏈接,每個旁邊都有一個 AI 生成的摘要。

可以看到,這是Google搜索結果頁面的new look。把AI生成內容放在最開始。

比起重新設計的微軟必應,搜索結果頂部的AI框對Google來說更像是,一個小小的更新。

值得註意的是,要是想要訪問這一功能,你必須選擇Search Generative Experience(SGE)這一新功能。

並非所有搜索都會有AI生成的答案。隻有當Google的算法認為它比標準答案更有用時,AI內容才會出現,而像健康、財務等敏感主題完全不會有AI生成。


Google表示,其改進後的搜索引擎能夠以對話方式跟蹤原始搜索查詢的選項,無需重復已經提供的上下文或細節。

然而,Google搜索也不是無所不能,也存在從未完全解決過的問題——結構編排(orchestration of structure)。

因為大部分數據儲存在互聯網上,甚至Google內部,但將所有這些數據放在一起形成一個連貫的答案真的很難。

目前,已經開放候補名單僅限美國,Google表示,未來幾個月將考慮更廣泛地推出這一功能。

一鍵退款,智能P圖,沉浸導航

一鍵生成退款郵件?

Google行。


劈柴在發佈會一開始就整個小活。航班取消得退款?不會寫申請退款的郵件?

gmail會。


隻要在prompt欄裡輸入要求,gmail分分鐘生成一篇有理有據有節的退款申請郵件。

另外,GoogleMap現在也有沉浸式view,你想去哪,懟臉的實景導航來。

你還能順便問問空氣質量、天氣、交通狀況,都能即時演示。


Magic Editor是Google最新公佈的照片處理功能,使用生成性AI,可以讓用戶在沒有專業工具的情況下對照片進行各種編輯。

不會p圖星人的福音來?

發佈會上,Google分享幾個應用這項新功能的案例,不得不說,效果酷炸。

比如下面這張,Magic Editor一鍵把瀑佈前的人像挪到側面,還把背景中別的遊客p掉。不僅如此,本來多雲的天氣硬是給p藍。


再比如下面這張,Magic Editor一鍵將長凳上的小孩連著凳子一起移到中間,自動補齊多出來的椅子,還把原畫中缺失的氣球補齊。

而且天也p藍。


當然,這項功能還沒到最完美的地步。就比方說,仔細看看上面這張圖片,凳子挪動,可是底下的影子沒動。

但總歸,這項功能對照片本身的理解是革命性的。

當然,咱現在還不用太擔心是不是有的圖片被Magic Editor處理過。因為Google說,下半年才會推出這項功能。

AI筆記本Project Tailwind

學生黨福音來。

不得不說,Google還真把學生們拿捏住。


Project Tailwind從本質上講,就是個筆記本,但是加AI的能力。

一下子就不一樣。

用戶可以像問導師或者學習搭子一樣進行在Tailwind裡進行檢索。

雖說Google把這個功能其定位為學生服務的工具,但是對於日常需要處理大量文本的打工人來說,也是重大利好。


Google產品管理高級總監表示,Tailwind就像一個真正的筆記本一樣,你在裡面記東西,而這些內容就是AI學習的對象。

用戶可以簡便地從Google雲端硬盤中挑選文件,有效創建一個兼具個性化和私人屬性的AI模型。

目前,該功能在大學校園內進行廣泛的測試。

在示例演示中,Tailwind收集一大堆學習筆記,然後,生成包括主題詞在內的很多內容,比如,用戶可以為特定主題創建術語表。

Tailwind不僅僅能為學生服務,它對任何從不同來源獲取信息的人都有幫助。


隱藏在Tailwind背後的理念是,為什麼我們不能為每個用戶定制不同的AI語言模型呢?

當然,這裡存在兩個問題。

一方面是成本問題。訓練語言模型所需的計算需求和微調成本都很高,誰來負擔這個成本?另一方面則是信息安全性。

畢竟,捏造信息這種事可一點都不稀奇,誰能保證個性化的筆記本不會出現同樣的問題呢。

不過,是騾子是馬還得拉出來遛遛。用戶目前可以註冊Project Tailwind進行測試。該功能也是AI Labs計劃的一部分。

Android開發小助手

此外,GoogleI/O大會上還推出專為Android開發的AI編碼機器人Studio Bot。

不僅可以生成代碼、修復BUG,甚至能夠回答關於Android應用開發的相關問題。

同時支持Kotlin和Java編程語言,並將直接嵌入到Android Studio開發工具的工具欄中。



相關推薦

2023-03-21

寬而被不少用戶吐槽為“邊框能跑馬”,今年蘋果可能要一雪前恥,iPhone 15 Pro將升級至1.55毫米的邊框,成為有史以來邊框最窄的iPhone,也超越一眾安卓旗艦機型。爆料稱,所有四款iPhone 15機型的邊框都將略微彎曲,類似於iPhone

2023-04-02

oogle風范”,最近GoogleCEO稱將推出Bard升級版,這次能否“一雪前恥”呢?Google首席執行官SundarPichai在3月31日接受HardFork播客節目采訪時表示,Bard將從基於輕量級LaMDA模型升級為更大規模的PaLM模型。Pichai指出:Bard正運行在一個輕

2023-12-07

傳說中的Gemini,終於在今天深夜上線!‘原生多模態’架構,是Google的史詩級創舉,Gemini也如願在多個領域超越GPT-4。這場仗,Google必不能輸。Google的復仇大殺器Gemini,深夜忽然上線!被ChatGPT壓著打整整一年,Google選擇在12月的

2024-05-11

就在剛剛,FFmpeg在社交媒體公開感謝騰訊公司向項目提交的高質量補丁。這稱得上是歷史性時刻——畢竟15年前,騰訊的知名產品QQ影音因不遵循開源協議使用代碼被FFmpeg釘在“恥辱柱”(HallofShame)。事件背景FFmpeg 全稱為 FastFor

2023-03-22

面對OpenAI和微軟的步步緊逼,Google終於不再坐以待斃。今日,Google宣佈正式開放旗下ChatGPT競爭對手Bard的公測,首先將面向美國和英國地區啟動。目前這兩個國傢的用戶都可以在bard.google.com上進行排隊等候,隨著測試的推進Bard也

2023-05-11

5月11日上午消息,北京時間今日凌晨,2023谷歌I/O大會正式舉辦,本次發佈會,在生成式人工智能熱潮的席卷之下,人工智能的影子遍佈整場谷歌I/O大會。發佈會現場,谷歌發佈第二代大語言模型AI語言模型PaLM2,基於新訓練模型

2023-05-11

5月11日消息,據外媒報道,當地時間周三,谷歌在谷歌I/O大會上發佈最新的人工智能(AI)語言模型PaLM 2,與OpenAI旗下的新一代大型語言模型GPT-4等系統展開競爭。2022年4月,谷歌首次發佈PaLM語言模型。PaLM 2在PaLM 1的基礎上進行

2023-05-17

據報道,谷歌上周發佈的最新大語言模型使用的訓練數據,幾乎是2022年的上一代模型的5倍。得益於此,該模型在編程、數學和創意寫作方面的表現更為優秀。谷歌是在其I/O開發者大會上發佈最新通用大語言模型PaLM2的。內部文

2023-05-11

北京時間5月11日凌晨消息,谷歌CEO桑達爾·皮查伊(SundarPichai)今日在谷歌I/O大會上發佈其最新的人工智能(AI)語言模型“PaLM2”,向OpenAI的GPT-4等競爭對手發起挑戰。皮查伊稱:“PaLM 2在邏輯和推理方面進行廣泛的訓練,具有

2023-05-12

過去兩個交易日,谷歌母公司Alphabet收盤漲幅連續超過4%,股價已經悄然回升到去年8月以來的最高價位,市值再次站上1.43萬億美元。看起來,谷歌在I/O大會上交出的AI成績單得到資本市場的認可。而這正是谷歌高層所希望傳遞出

2023-05-11

快科技5月11日消息,谷歌年度開發者大會Google I/O 2023上,PaLM 2大模型正式發佈,準備向OpenAI的GPT-4等競爭對手發起挑戰。據解,PaLM 2是谷歌首個從頭開始構建的多模態模型,具有不同規模的高度能力,並能有效地與其他工具和API

2023-12-07

谷歌憋許久的大招,雙子座Gemini大模型終於發佈!其中一圖一視頻最引人註目:一圖,MMLU多任務語言理解數據集測試,GeminiUltra不光超越GPT-4,甚至超越人類專傢。AI實時對人類的塗鴉和手勢動作給出評論和吐槽,流暢還很幽默

2023-03-24

先笑一下,谷歌自己開發的人工智能工具,居然主張分拆谷歌阻止壟斷?在反壟斷的問題上,谷歌剛剛開放公測的生成式AI Bard相當地大義滅親。本周二,谷歌宣佈生成式AI Bard推出Beta測試版,逐步分批向註冊

2023-05-11

谷歌將其人工智能聊天機器人bard升級為最新的語言模型palm 2,增強其功能,並增加視覺搜索,人工智能圖像生成以及與谷歌地圖集成等新功能。升級後的bard還支持多種語言,並可以將生成的內容導出到google docs和gmail。此次升級