谷歌CEO皮查伊深度解析谷歌史上最強大模型Gemini及即將到來的人工智能時代


12月7日消息,美國當地時間周三,谷歌發佈其新一代人工智能模型Gemini。Gemini反映谷歌內部多年來在首席執行官桑達爾·皮查伊(SundarPichai)的監督和推動下所做的努力。此前負責Chrome和安卓業務的皮查伊是出名的產品迷。2016年,他在擔任首席執行官後的首封年度創始人信函中預測:“我們將從移動優先轉向人工智能優先的世界。”

從那以後的幾年裡,皮查伊就開始將人工智能技術逐漸融入到谷歌的所有產品中,從安卓設備一直到雲計算。

盡管如此,谷歌最近的風頭逐漸被OpenAI搶走,後者於去年推出的DALL-E和GPT-3.5,以及今年推出的GPT-4,主導整個人工智能行業,並引發初創公司和科技巨頭之間的激烈競爭。

Gemini現在是這場競爭的最新加入者。該系統由谷歌DeepMind領導,這是一個由德米斯·哈薩比斯(Demis Hassabis)領導的新整合部門。現在,我們已經可以在谷歌聊天機器人Bard中體驗Gemini,它將在2024年整合到谷歌的產品線中。

在Gemini發佈前夕,《麻省理工學院技術評論》雜志在谷歌位於加州山景城的辦公室采訪皮查伊,討論該模型對谷歌、其產品、人工智能和整個社會的意義。

以下為專訪內容:

問:為什麼Gemini如此令人興奮?你能告訴我你對人工智能的總體看法嗎?它的力量,它的用處,它在你們所有產品中的發展方向?

皮查伊:Gemini令人興奮的一個特別之處在於,它從一開始就是一個原生的多模式模型。就像人類一樣,它不僅僅是在文本上學習,還可以通過視頻、音頻和代碼學習。因此,這個模型天生就能力更強,我認為這將幫助我們梳理出更新的功能,並為該領域的進步做出貢獻。這太令人興奮。

另一個讓人覺得興奮的地方是,Gemini在32個主要基準測試中,有30個都是表現最好的,尤其是在多模式基準測試中。在MMLU(大規模多任務語言理解)測試中,它顯示更大的進步。我個人認為,作為領先基準之一的MMLU,Gemini突破90%的門檻,這是一個重大的裡程碑。兩年前的水平是30%,隨後是40%。由此可以看出,這個領域取得多大的進步。在57項測試中,Gemini的表現在89%的時候相當於人類專傢。這是第一個跨越這個門檻的模型。

我也感到很興奮,因為Gemini終於進入我們的產品。它將對開發者開放。這是一個平臺。人工智能是一個深刻的平臺變革,比網絡或移動變革更大。因此,從那一刻起,這對我們來說代表著邁出一大步。

問:讓我們從這些基準開始。Gemini似乎在幾乎所有測試方面都領先於GPT-4,但並不是遙遙領先。而GPT-4似乎是一個很大的飛躍。我們是否開始在這些大語言模型技術所能做到的事情上趨於停滯,或者你認為我們將繼續擁有巨大的增長空間?

皮查伊:首先,展望未來,我們確實看到很大的增長空間。有些基準已經很高。你必須意識到,當你試圖從85%開始突破的時候,你已經處於曲線的邊緣。雖然看起來不是很多,但那的確代表正在取得進展。我們還需要更新的基準測試,這也是我們研究MMLU多模式基準的部分原因。對於其中一些新的基準,目前的技術水平仍然要低得多,未來還有很大進步空間。比例定律仍然有效:當我們把模型做大的時候,就會有更多的進展。當我把它放在整體上看時,我真的覺得我們才剛剛開始。

問:我很感興趣的是你認為Gemini的關鍵突破是什麼,以及它們將被如何應用?

皮查伊:人們很難想象將會發生什麼樣的飛躍。我們正在提供應用程序開發接口(API),人們會以非常深刻的方式去體驗它。我認為多模式基準將大有發展。隨著我們教會這些模型更多地進行推理,將會有越來越大的突破,而且更深層次的突破還在後頭。

解決這個問題的一種方法是Gemini Pro,它在基準測試中表現非常好。但當我們把它放進Bard時,我可以作為一個用戶感受到這一點。我們一直在測試它,所有類別的好評率都有相當大的提升。為此,我們稱它為我們迄今最大的升級之一。當我們同時進行並行評估時,它確實顯示出優異的表現。所以你讓這些更好的模型在基準上得到改進,它會取得進步。我們會繼續訓練,然後繼續學習。

但我迫不及待地想把Gemini應用到我們的產品中。這些模型功能非常強大。在接下來的幾個月裡,真正設計產品體驗以利用所有模型所擁有的東西將是令人興奮的。

問:Gemini幾乎在所有方面都勝過GPT-4,但隻是領先一點點?我想知道你們從GPT-4的發佈中學到什麼?你學到什麼?在這段時間內,哪些方法發生變化?

皮查伊:至少在我看來,這與零和遊戲相去甚遠。想想看,向人工智能的轉變是多麼深刻,我們還處於早期階段,前方的世界充滿機遇。

但對於你的具體問題,這是一個我們都在快速進步的領域。我們發表很多文章,看看像GPT-4這樣的模型在現實世界中是如何工作的。我們從中吸取教訓。安全是一個重要的領域。所以在Gemini項目中,我們已經學習並改進一些安全技術,這些技術是基於模型在現實世界中的運作方式改進的。它表明微調等各種事情的重要性。我們在Med-PaLM 2中展示的一件事是,采用一個像PaLM這樣的模型,對它進行微調,以適應特定的領域,顯示它可以勝過最先進的模型。這就是我們學習微調力量的一種方式。

當我們研究Gemini的時候,這其中的很多經驗都被用到。我們花更多時間研發Gemini Ultra(更先進的Gemini將於明年上市)的部分原因是為確保我們對其進行嚴格的安全測試。但我們也在對它進行微調,以真正梳理它的功能。

問:當你看到這些模型被發佈出來,人們開始在現實世界中測試它們時,發現它們會產生幻覺,或者會透露某些模型訓練的私人數據。我想知道,考慮到其所使用的數據,如果這是不可避免的,那麼這在技術中有多少是固有的。如果這是不可避免的,你會嘗試做哪些事情來限制它?

皮查伊:你是對的。這些都是活躍的研究領域。事實上,我們剛剛發表一篇論文,展示這些模型如何通過一系列提示來泄漏訓練數據。幻覺還不是一個可以解決的問題,但我認為我們都在取得進展,隻是還有更多的工作要做。我們需要克服一些基本的限制。舉個例子,如果你用Gemini Ultra,我們正在積極地將這些模型與外部第三方合作,他們是這些方面的專傢。

在多模式等領域,我們想要更大膽,我們想要負起責任。我們將更加小心多模式模型的推出,因為錯誤用例的可能性更高。但你是對的,它仍然是一項正在開發中的技術,它們不會對所有事情都有意義,在搜索中,我們會更加小心地考慮如何使用它,何時使用,在哪裡使用,以及何時觸發它。它們有很多驚人的能力,但也有明顯的缺點。這是擺在我們所有人面前需要解決的艱巨挑戰。

但未來的人工智能系統可能與我們今天擁有的不一樣,這就像有人認為你不可能把電腦裝進口袋一樣。同樣地,看著這些系統,說你無法再設計出更好的系統,我不同意這種觀點。已經有許多研究探索正在進行中,思考如何解決這些問題。

問:你認為人工智能將帶來深刻的變革。在最近的一些轉變中,比如向移動設備的轉變,它並不一定會提高生產率,這在很長一段時間內,生產率一直保持未變。還有一種觀點甚至認為,它甚至可能加劇收入不平等。谷歌正在做什麼樣的工作來確保這種轉變對社會更有益?

皮查伊:這是個非常重要的問題。我從幾個層面上思考這個問題。在谷歌,我們一直關註的一件事是:我們如何讓技術盡可能廣泛地使用?我認為,即使是在移動領域,我們利用安卓做很多工作,但仍有數億人依然無法使用手機。我們正在努力推出一款價格合理的智能手機,價格可能低於50美元。

所以,讓人工智能對每個人都有幫助是我考慮的重點。你試著讓盡可能多的人接觸到你。我認為這是其中的一部分。

我們正在深入思考如何將人工智能應用到對人們有益的用例中。例如,我們早期做洪水預報的原因是因為我們意識到,我們可以探測到模式,並且做得很好。我們用它來翻譯100種語言。我們現在確實在嘗試用不同的語言提供內容,否則你將無法訪問這些內容。

這並不能解決你說的所有問題。但要慎重考慮,何時何地你將專註於解決什麼樣的問題。以AlphaFold這樣的領域為例。我們為世界各地的病毒提供一個開放的數據庫。但是,誰會最先使用它?人工智能不會神奇地讓某些更困難的問題變得更好,比如不平等,還是它可能會加劇這種情況?

重要的是,你要確保每個人都能使用技術。你在早期開發它,讓人們接觸到它,參與到對話中,這樣社會就可以幫助測試它,並適應它。

在這項技術上,我們肯定比其他公司參與得更早。你知道,最近我們參加英國人工智能安全論壇,並在美國與國會和政府合作,我們正在嘗試建立更多的公私合作夥伴關系,更早地吸引非營利機構和學術機構參與進來。至於對就業等領域的影響,還需要深入研究,但我確實認為會有驚喜。

我可以舉很多例子來說明手機帶來的好處,我認為人工智能技術也是如此。我們已經在糖尿病視網膜病變等領域展示這一點,畢竟世界上許多地方沒有足夠的醫生來檢測這種疾病。就像我覺得讓世界各地的人們都能使用谷歌搜索一樣,我認為這是擴大人工智能使用范圍的一種方式。

問:有些事情顯然會幫助人們更有效率。編程就是一個很好的例子。然而,這項技術的普及正在威脅就業。即使你不能為社會提供所有的答案,一傢公司也可以推出一款能夠改變世界並產生深遠影響的產品。

皮查伊:我們從未提供面部識別API,但其他人開發API,技術正在向前發展。因此,它並非掌握在任何一傢公司手中。我認為答案要復雜得多。社會也可能被甩在後面。如果你不采用這些技術,它可能會影響你的經濟競爭力。你可能會失去更多的工作。

我認為正確的答案是負責任地部署技術,並取得進步,思考它可能造成更嚴重傷害的領域,並努力減輕它。同時,也將會出現新的工作類型。如果你看一下過去的五六十年,麻省理工學院的經濟學傢們的研究表明,大多數新創造的就業機會都是在自那以後出現的新領域。

將會有新的工作機會出現,會有更好的工作,人們將會被從一些重復性的工作中解放出來,你可以更有創造性地表達自己。你可以是醫生,可以是放射科醫生,也可以是程序員。你花在日常任務上的時間與深度思考的時間,所有這些都可以改變,讓工作變得更有意義。還有些工作崗位可能會被取代。那麼,作為一個社會,你如何再培訓,重新培訓人們,創造機會?

問:去年,人們在看待人工智能的方式上出現哲學分歧。你可以支持安全第一,或者商業用例優先,你可以支持加速論者,也可以是末日論者。你所處的位置是,你必須把所有這些哲學聯系起來,把它們結合起來。我想知道,你個人是如何看待谷歌把這些興趣聯系起來的,畢竟谷歌將成為這個領域的領導者,進入一個新世界。

皮查伊:我是一個技術樂觀主義者。基於我的個人生活,我一直對人和人性抱有信念。所以,總的來說,我認為人類將利用技術為自己造福。所以我一直是個樂觀主義者。你說得對,像人工智能這樣強大的技術有二元性。

這意味著,有時我們會大膽地向前邁進,因為我認為我們可以推動最先進的技術。例如,如果人工智能可以幫助我們解決癌癥或氣候變化等問題,你會想盡一切辦法讓它快速發展。但你肯定需要社會制定框架來適應,無論是深度造假還是取代工作等等。這將成為一個前沿領域,與氣候變化沒有什麼不同。這將是我們所有人在未來十年努力解決的最大問題之一。

問:另一個懸而未決的問題是圍繞人工智能的法律法規。有關於合理使用的問題,有關於能否保護版權的問題。對於知識產權來說,這似乎將是一件大事。你如何告訴那些使用你產品的人,讓他們有一種安全感,他們所做的事情不會讓他們被起訴?

皮查伊:並不是所有的問題都有簡單的答案。在人工智能出現之前,當我們開發搜索、YouTube等產品時,我們一直在努力實現正確的價值交換。人工智能也是如此。我們肯定會專註於確保我們可以根據法律允許的數據進行培訓,讓人們有機會選擇退出。還有一個層面是關於什麼是合理使用。為原創內容的創造者創造價值是很重要的,這些都是重要的領域。互聯網就是一個例子,或者當電子商務開始時:你如何在電子商務和常規商務之間劃清界限?

隨著時間的推移,會有新的法律框架出現,這就是我對這個領域發展的看法。但與此同時,我們將努力遵守法律,並確保我們今天也與許多內容提供商保持深厚的關系。有一些領域存在爭議,但我們正在努力解決這些問題。我們必須創造一個雙贏的生態系統,讓所有這些都能長期發揮作用。

問:當下人們對網絡的擔憂很多集中於搜索的未來。當你有一種技術可以根據網絡上的信息為你回答問題時,有人就會擔心人們可能不再需要訪問這些網站。這似乎也會對谷歌產生影響。我想知道你是否在考慮你自己的生意?

皮查伊:我們在搜索方面的一個獨特價值主張是,我們幫助用戶發現和學習新事物,並找到答案,但始終著眼於與他們分享網絡上存在的豐富、多樣性觀點。這也是我們開發產品的一個重要原則。我不認為人們在搜索時總會說:“幫我回答就好。”也許有一兩個問題是你想要的,但即使你回來,你會學到更多,甚至在這個過程中,你會走得更深入。我們總是想要確保我們做的是正確的,我認為這一點不會改變。重要的是我們要保持平衡。

同樣,如果你深入地傳遞價值,你所傳遞的東西就會有商業價值。從臺式機到移動設備,我們都有類似的問題,這對我們來說並不新鮮。基於我們所看到的一切以及用戶對高質量廣告的反應,我感到很放心。YouTube就是一個很好的例子,我們開發訂閱模式。這也很有效。

問:當這些產品開始真正進入市場並開始互動時,你認為明年人們的體驗會發生怎樣的變化?

皮查伊:我想從現在開始的未來一年,任何開始使用Google Docs的人都會期待一些不同的東西。如果你把它給他們,然後把它們放回到我們在2022年擁有的Google Docs版本中,他們會發現其已經過時。這就像,對我的孩子來說,如果Google Docs沒有拼寫檢查,他們基本上會認為它出問題。我們可能還記得在拼寫檢查之前使用這些產品是什麼感覺。但與其他公司相比,我們在搜索中融入如此多的人工智能,人們已經認為這些自動功能是理所當然的。這是我多年來學到的一件事,讓他們認為這是理所當然的。

就人們可以做的事情而言,隨著我們開發多模式能力,人們將能夠以一種他們以前無法做到的方式完成更復雜的任務。而且將會有真正的用例,它們的功能要強大得多。(小小)


相關推薦

2023-11-17

官桑達爾·皮查伊(SundarPichai)表示,他預計中國將走在人工智能的“前沿”,並稱美國在人工智能監管和創新方面與亞洲國傢合作非常重要。皮查伊在舊金山參加亞太經合組織會議期間接受采訪時說,中國人工智能項目的規模

2023-12-07

發帖稱:“介紹Gemini1.0,我們迄今為止最強大、最通用的人工智能模型。它的內置是多模式的,這是我們Gemini模型時代的第一步。Gemini優化三種尺寸-Ultra,Pro和Nano。Gemini Ultra的性能在32項廣泛使用的學術基準中有30項超過目前最

2024-04-08

谷歌在推出與OpenAI的ChatGPT競爭的產品方面遇到挑戰。盡管公司內部已經測試多個生成式AI軟件模型數月,但沒有一個模型被認為足夠成熟以作為GPT-4的競爭對手推出。谷歌在生成式AI領域的掙紮與其龐大的公司規模、分散的組織

2023-12-04

12月4日消息,據外媒報道,谷歌已將其下一代人工智能(AI)模型Gemini的發佈時間推遲到明年1月。據外媒報道,在谷歌“發現該AI模型不能可靠地處理一些非英語查詢”後,谷歌CEO桑達爾·皮查伊(Sundar Pichai)做出推遲發佈Gemini

2024-03-03

在Google遭遇的情況正在很艱難。這傢搜索巨頭已經感受到人工智能領域突然而激烈的競爭的熱度,並在公開場合引發一些混亂。Google剛剛暫停其Gemini圖像生成器,該生成器正在創建歷史上不準確的圖片。這次失誤非常嚴重,導致

2023-12-07

速人類進步和改善生活的機會。我相信我們現在所看到的人工智能轉變將是我們一生中最深刻的轉變,遠遠大於之前向移動或網絡的轉變。人工智能有潛力為世界各地的人們創造從日常生活到非凡的機會。它將帶來新一波的創新

2024-05-10

谷歌母公司AlphabetCEO桑達爾·皮查伊(SundarPichai)近日在做客《TheCircuitWithEmilyChang》節目,與主持人進行一場深度訪談。他表示,AI目前還處於發展的早期階段,相信谷歌最終將贏得這場戰爭,正如谷歌當初並不是第一傢做搜索的

2024-03-13

谷歌周二表示,將限制人工智能聊天機器人Gemini回答有關今年全球范圍內大選的問題,以避免可能出現的失誤。過去一年生成式人工智能(包括圖像和視頻生成)取得長足進步,同時卻引發公眾對錯誤信息和假新聞的擔憂,並促

2023-02-07

查伊公開宣佈谷歌的新對話技術後不久發佈的,該技術由人工智能驅動,並且將在未來幾周開始推廣。谷歌面臨著來自投資者和員工的壓力,要與微軟支持的OpenAI的聊天機器人ChatGPT進行競爭,後者在去年年底推出時引起公眾的

2024-04-22

斯和萊格結識於倫敦大學學院,兩人分別擁有神經科學和人工智能的博士學位。蘇萊曼則專註於產品開發和政策方面。或許和哈薩比斯與蘇萊曼分別擁有劍橋和牛津的學習經歷有關,幾年之內,許多劍橋和牛津的研究人員來到Dee

2023-05-12

日程從以往的三天精簡到一天,主角從始至終隻有一個:人工智能。這並不是谷歌I/O首次變成AI技術展示會,早在2017年,谷歌CEO皮查伊就喊出“從移動優先轉向AI優先”的口號,將深度學習的AI技術逐步落地在谷歌的各項產品之

2023-03-30

據報道,OpenAI不僅憑借人工智能聊天機器人成功超越谷歌,還意外促成另外一件原本幾乎不可能發生的事情:這迫使Alphabet旗下谷歌以及DeepMind的兩大人工智能研究團隊暫時擱置多年的恩怨,決定聯手追趕OpenAI。知情人士透露,

2024-02-02

活回歸線下,科技企業難免會重新整合組織結構。而通過人工智能工具強化自己的技能包,或許是全球科技行業從業者的新風向。隻有終身學習,才能處處發光。

2024-03-07

GoogleGemini文生圖風波還未平,更勁爆的內幕消息又被曝出來。PirateWires爆料,Gemini這次的翻車,Google內部此前並不是毫不知情,翻車甚至是“故意”導致的。具體來說,Google設置一個“安全”架構,Gemini要生成一張圖實際上要經