在跟Google矽谷總部一街之隔的ShorelineAmphitheatre露天劇場上,開發者和媒體參會者們早早地聚集於此。相較於過去這兩年人文氣息偏重、重磅產品較少的IO大會,已經拉響紅色警報的Google今年顯然卯足勁,無論還是AI更新還是全新的硬件產品,今年GoogleIO都可以說是近幾年來少有的一場科技盛會。
尤其突出的是,Google此次重磅打出一系列AI組合拳,旗下幾乎所有產品都開始跟AI進行全面集成、並進行跨越式升級。在當前AI競賽中起跑慢一步的Google似乎已經不再藏著掖著,作為AI領域的長期領導者,在本次IO上,Google充分向大眾展現其巨大的AI能量和潛力。
在正式Keynote開始之前,現場首先預熱幾首由Google全新音樂AI工具MusicLM 和 Bard參與創作的迷幻電子音樂。
現場播放的AI制作的音樂《ducks with lips》,矽星人現場拍攝
在一片歡樂的氣氛中,GoogleCEO皮柴登場,幾句簡單的寒暄後他直擊主題,“眾所周知,人工智能今年非常忙碌,而作為一傢 AI-first 公司,我們有很多話要談。所以,讓我們開始吧。”
Gmail、Maps等AI升級,創造更智能的生活體驗
活動的一開始,Google先上幾個“開胃前菜”。皮柴表示,Google的AI技術其實已經被大量融入到一些跟用戶日常生活息息相關的軟件之中,比如Gmail、Google 地圖和圖片編輯。
首先,大傢期盼已久的Gmail自動寫郵件功能終於來。早在2017 年Gmail就推出郵件的Smart Compose一鍵簡短回復功能,而今天,Google在此基礎上推出一個名為“Help Me Write”的全新功能,能夠幫助你快速撰寫完整的郵件和回復。
在IO上,Google展示一個向航空公司申請退款用例,你隻需告訴Gmail你想要退款的意圖,它就會根據你的航班詳情寫一份完整的郵件,同時也可以調整不同的語氣。
GoogleMap則引入一個全新的3D沉浸式路線視圖功能。在 AI 和計算機視覺技術的幫助下,Google將數十億張航拍和街景圖像融合在一起創建空間 3D 模型。也就是說,未來你用Google Maps進行路線導航時,你看到的不僅隻是從A到B的2D路線,而是能夠以可視化的形式看到道路和周邊的建築情況,甚至包括當地實時天氣、交通等。
Google表示,這個功能將在今年很快上線,首先將在包括阿姆斯特丹、柏林、都柏林、佛羅倫薩、拉斯維加斯等15個城市推出。
此外,名為Magic Editor圖片編輯功能讓小白也能輕松改圖。跟蘋果此前的圖片功能類似,Magic Editor可以對照片中的不同事物進行識別,並允許你用拖拉拽的方式進行編輯。比如把人往左邊右邊拉一下,讓構圖更加符合你的想象。
最強語言模型PaLM2亮相,Bard能力爆炸躍升
幾個小功能熱身之後,接下來,Google此次真正的硬菜開始接連登場。首先,像此前大傢猜測的一樣,Google推出下一代超強語言模型PaLM 2。
PaLM 是 Google 在 2022 年 4 月宣佈的大語言模型,使用5400 億參數進行訓練,約是GPT-3的三倍。此次PaLM 2又在PaLM上進一步進行提升和改進,具有多語言、推理和編碼功能。
PaLM 2 在多語言文本方面接受更多的訓練,涵蓋 100 多種語言,對於理解、生成和翻譯包括成語、詩歌和謎語在內的細微差別文本的能力非常顯著,還通過“精通”級別的高級語言能力考試。
在推理方面,PaLM 2 的數據集包括科學論文和帶有數學表達式的網頁,擁有超強的邏輯、常識推理和數學能力。
同時,PaLM2在大量公共源代碼數據集上進行預訓練,寫代碼能力更強。除 Python 和 JavaScript,還包括在 Prolog、Fortran 和 Verilog 中生成專用代碼等。
值得註意的是,PaLM 2已經被開發出不同的版本,可以面向不同的客戶、部署在不同企業環境中。
目前,PaLM 2有四種規格,從小到大依次為Gecko、Otter、Bison和Unicorn,其中,體積最小的Gecko可以在手機上運行,每秒大約可處理20個Token,也就是約16或17個單詞。也就是說,開發者們不用花費大量的時間和資源來創建和調整PaLM 2,而是能夠直接拿來就用進行部署。
在Google內部, PaLM 2也早已經被用在自傢的25項功能和產品之中,其中也包括AI聊天機器人Bard、Google的全線辦公套件等。
在PaLM 2的加持下,此次Bard也開始真正的顯現出“ChatGPT殺手”的實力。
此前Bard是基於LAMDA 開發,該模型擁有1370億種參數,但現在Bard已經全面轉用PaLM,在答案生成的數據組和更多元化的內容方面能力飛升。同時,Google將Bard跟旗下和外部產品的集成,讓Bard也跳出聊天機器人的范疇,而是真正讓其成為一款實用性工具。
比如現在Bard為你提供答案時,除文字之外,還能提供包括圖片、視頻、外部鏈接等多元化的信息。
比如你在問Bard問題之後,你現在可以將這些問題答案一鍵導出到Gmail、Google文檔、表格之中,Bard還可以動幫你給圖片、文檔等做加標註。未來也將支持更多Google應用程序和Bard的集成體驗,包括Drive、地圖等。
對於軟件工程師們來說,Bard提供改進後的代碼引用功能,在提供來源的同時還能解釋代碼片段。此外,現在開發者們也可以把Bard生成的代碼進行導出,不僅能發送到Google的Colab平臺,還能和另一個基於瀏覽器的IDE Replit一起使用(目前支持首先Python)。
目前Bard能支持20多種編程語言,基本涵蓋工程師們所有編程開發需要,並為開發者們提供新的深色界面。開發者們隻需輸入prompt就能得到完整的代碼片段。
此外,跟ChatGPT類似,Bard現在也可以跟其他外部工具進行集成使用。在IO上Google也展示一個Bard跟Adobe Firefly合作生成圖片的例子,比如你想給孩子辦一個生日派對需要做一個請柬照片,所要做的就是給Bard說“制作一張在兒童派對上獨角獸和蛋糕的圖像”,接著在Adobe的支持下它會在幾秒鐘內生成四張圖像。這不就是Midjourney復雜操作方法的替代嗎?
除Adobe之外,Bard目前還在推進跟更多外部工具的集成使用,包括 Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy等。
尤其重要的是,現在人人都可以用上Bard。Google此次取消等候隊列,Bard將面向180多個國傢和地區的用戶全面開放。此外在英語之外,還增添日語和韓語兩種語言,未來將逐步支持40種語言的交互。
回擊微軟Copilot,Google工作套件迎來“Duet AI”
今年 3 月,微軟宣佈推出Copilot之後,在生產力工具領域掀起一場革命。Google當時馬不停蹄地也為其 Workspace 應用程序套件宣佈一系列人工智能功能,爭取在跟微軟的競爭中不掉隊。當時,這些人工智能功能還比較零散,並沒有一個類似於Copilot這樣系統性的工具。
但在今天的IO上,Google終於給出它的對標方案——Duet AI。
跟微軟Copolit類似,Duet AI將被全面集成至Google旗下的Work Space,包括Google文檔、表格、幻燈片、會議、GmailMeet的自動會議摘要等等。同時還推出一項名為Sidekick的新功能,能夠跨不同的Google應用程序進行閱讀、總結和回答文檔中的問題。
比如在文檔之中,直接輸入文章主題就能完整的生成一篇文章。
在Google表格中,僅需輸入一句話“遛狗業務客戶和寵物統計”就能自動生成完整的表格,包含狗、地址、電子郵件、日期、時間、持續時間和費用等,還可以通過自然語言命令來對表格進行編輯。
在演示文稿中根據你的在側邊欄輸入的要求自動生成PPT和插圖,並且按時間要求幫演示者總結每一頁的演講稿的講話內容等等。
雖然這些功能我們在微軟此前辦公套件中都多多少少看到過,但對於Google來說,此次Duet AI的推出,讓我們看到Google在面對Copilot等競爭對手時的應對能力。
而除應用於辦公套件中之外, Duet AI 也將被應用於Google雲業務之中。借助Duet AI,Google雲推出一系列開發者工具,包括可以提供實時代碼幫助,指出錯誤的同時推薦生成的代碼塊,以及回答代碼和Google雲相關的問題等。該功能支持 Go、Java、Javascript、Python 和 SQL等多種語言。Google表示,目前在Google雲上進行 AI 的訓練速度提高 80%,成本降低 50%。
但目前,Google辦公領域的Duet AI功能還沒有對公眾進行開放,如果想試用這些新工具,需要先註冊“工作場景實驗室(Workspace Labs)”並加入等候名單。
生成式AI上線Google搜索,數十億用戶即將開啟搜索新旅程
面對Bing的步步緊逼,作為Google的立身之本,搜索業務此次也迎來重大的AI更新。
跟Bing類似,在用戶搜索問題之後,搜索欄的下方會首先出現由AI提供的更直接的答案,以及與這個問題相關的圖片、鏈接、視頻等。根據第一次提問返回的信息,你還可以進一步進行交互查詢更多的信息,知道你得到最需要的答案。
而當你打算通過Google搜索並購買一款產品時,AI不僅能夠為你返回你需要的產品鏈接還能夠為你想購買的產品提供摘要,包括提醒你購買時需要註意的事項、產品的特點、最新的評論等等。
這種新的基於搜索的AI 購物體驗建立在Google的 Shopping Graph之上的,該Shopping Graph 擁有超過 350 億個產品列表,是目前世界上最全面的、且動態更新的產品、賣傢、品牌、評論和庫存數據集。但Google同時也強調,廣告與自然搜索結果將被區分開來,不會影響用戶的使用體驗。
雖然AI功能登陸Google搜索令人振奮,但在全球數十億用戶面前,Google的推進步伐仍然相對謹慎。跟Duet AI的工作場景實驗室(Workspace Labs)”類似,為測試全新的搜索功能,Google也設立一個新的“搜索實驗室(Search Labs)”,用戶如果想要訪問這新的搜索功能,必須選擇一個名為 Search Generative Experience(簡稱 SGE)的功能。
此外,Google也強調並非所有搜索都會引發 AI 答案,隻有當 Google 的算法認為它比標準結果更有用時AI 才會出現,而有關健康、財務等敏感主題的信息則不會出現。
一些全新的硬件亮相,首款可折疊的Pixel手機問世
除一系列AI更新之外,一些Google硬件粉也非常關註Google今年的產品更新,此次Google也誠意滿滿,拿出首款折疊手機、新的平板電腦和更親民的Pixel手機
Google的首款折疊屏產品亮相,售價1799美元起
而今年的硬件產品中,關註度最高的當屬Google的首款折疊屏產品 Pixel Fold。該手機的造型非常類似OPPO發佈的Find N系列,也采用“翻開即橫屏”的操作理念,讓用戶在使用折疊屏內屏時無需在旋轉90度才可以達到全屏顯示的效果。
該機器的內屏使用一塊7.6英寸120Hz OLED柔性顯示屏,屏幕比例為5:6,分辨率為2208*1840,官方宣稱峰值亮度可達到1450nit。而外屏則為5.8英寸 120Hz OLED外屏,屏幕比例為9:17.4,分辨率2092*1080,峰值亮度可達到1550nit。
Pixel Fold,矽星人現場拍攝
性能方面,Google Pixel Fold搭載與Pixel 7系列相同的自研Tensor G2 處理器+ Titan M2 協處理器,配合12GB LPDDR5 內存 + 256/512GB UFS 3.1 存儲組成Google的“性能鐵三角”。Pixel Fold擁有4821毫安時電池,支持30W有線快充,但不出意外的話Pixel Fold應該算是今年售價超1萬元的旗艦產品中充電速度最慢的產品。
在發佈會之前,Google宣稱Pixel Fold會擁有“Pixel級別的影像系統”,與爆料不同的是,Google Pixel Fold的後置鏡頭模組選擇48MP廣角(支持OIS)+10.8MP超廣角+10.8MP 5倍長焦的三攝組合。
Pixel Fold,矽星人現場拍攝
該機擁有黑白兩個配色,12GB+256GB的版本售價1799美元(約12450元人民幣),12GB+512GB版本售價1919美元(約13280元人民幣),現在預定購買可免費獲贈一支Google在去年發售的 Pixel Watch手表。
平板電腦終於回歸,但不跟iPad搶市場
除去Pixel Fold之外,Google還在這屆I/O上正式發佈另一款大屏產品:Google Pixel Tablet。這也是Google沉寂多年後重返平板電腦市場的第一款產品,它的定位與目前市面上的平板電腦不同,更像是一個傢庭智能終端設備。
Pixel Tablet 圖源:Google
Pixel Tablet並不是一款剛公佈的產品,它的首次亮相是在一年之前。Google認為平板電腦更多的使用場景是在傢中而非室外,它是智能傢居中樞,也是用於流媒體播放及視頻通話的多媒體終端。為此,Google為Pixel Tablet配備一個磁力吸附的充電底座,讓它可以長時間處於有電的狀態。
Pixel Tablet依舊使用Google自研Tensor G2 處理器,搭配8GB運行內存,128GB/256GB存儲,售價499美元起(約3450元人民幣),不含底座。
入門級Pixel 7a發佈,新增紅藍CP雙色
廉價版的Google Pixel a系列一直都會在正代Pixel發佈的次年推出,Google Pixel 7a也不例外。該手機的外觀與Google Pixel 7采用相同的設計語言,新增更加活潑的珊瑚色和海洋藍兩個配色,更加適合有活力的年輕用戶。
矽星人現場拍攝
相比去年發佈的Pixel 6a,7a的升級主要體現在處理器與攝像頭方面。Pixel 7a使用與Pixel 7系列相同的自研Tensor G2芯片,並且將鏡頭模組升級為64MP廣角+13MP超廣角的組合,成像質量將會有非常明顯的進步。
與Google Pixel 7系列不同的是,Pixel 7a僅有8GB+128GB存儲這一個容量可選,但卻分為支持Sub 6 5G與mmWave 5G(毫米波)兩個版本,其中Sub 6 5G版本的售價為499美元(約人民幣3450元人民幣),而mmWave 5G版本的售價稍貴,為549美元(約3800元人民幣)。
總體來看,今天GoogleIO是一場誠意滿滿的大會,在整個開幕演講中,Google多次提到“大膽而負責任(bold and responsible)”這個詞,試圖證明Google可以在對社會和業務負責任的同時仍然可以快速行動。
在此前的訪談中,皮柴曾表示Google並不擔心推出語言模型的步伐較對手慢,把事情做對比搶快更加重要。而現在,Google似乎已經做好一切準備。