人工智能軍備競賽白熱化:谷歌最新AI大語言模型數據量擴充5倍


據報道,谷歌上周發佈的最新大語言模型使用的訓練數據,幾乎是2022年的上一代模型的5倍。得益於此,該模型在編程、數學和創意寫作方面的表現更為優秀。谷歌是在其I/O開發者大會上發佈最新通用大語言模型PaLM2的。內部文件顯示,該模型采用3.6萬億個令牌(token)進行訓練。


令牌指的是單詞串,這是訓練大語言模型的重要基礎,因為這可以教給模型如何預測字符串中可能出現的下一個單詞。

之前版本的PaLM發佈於2022年,當時使用的令牌為7800億個。

雖然谷歌很希望展示其人工智能技術的實力,以及嵌入搜索、電子郵件、字處理和電子表格後的效果,但該公司卻不願發佈其訓練數據的規模和其他細節。微軟支持的OpenAI也對其最新的GPT-4大語言模型的細節信息保密。

這些公司表示,之所以不披露這些信息,是出於商業競爭考慮。谷歌和OpenAI都在努力吸引想要用聊天機器人代替傳統搜索引擎,從而直接獲取答案的用戶。

但隨著人工智能軍備競賽日趨白熱化,相關研究人員也呼籲企業加大透明度。

自從發佈PaLM2之後,谷歌一直表示新的模型比之前的大語言模型更小,這就意味著該公司的技術效率得以提升,但卻可以完成更加復雜的任務。內部文件顯示,PaLM2基於3400億個參數訓練——這項指標可以說明該模型的復雜程度。最初的PaLM則基於5400億個參數訓練。

目前,谷歌尚未對此置評。

谷歌在一篇關於PaLM2的博文中表示,該模型使用一種名為“計算機優化擴張”的新技術。這就讓大語言“更高效、整體性能更好,包括加快推理速度、減少參數調用和降低服務成本。”

在宣佈PaLM2時,谷歌證實此前的媒體報道,計該模型針對100種語言進行訓練,可以執行更廣泛的任務。它已經被用於25項功能和產品,包括該公司的實驗性聊天機器人Bard。按照從小到大的規模劃分,該模型共有4種,分別是壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn)。

根據公開披露的信息,PaLM2比現有的任何模型都更加強大。Facebook在2月份宣佈的的LLaMA大語言模型采用1.4萬億個令牌。OpenAI上一次披露GPT-3的訓練規模時表示,它當時基於3000億個令牌。OpenAI今年3月發佈GPT-4時表示,它在許多專業測試中展示出“與人類媲美的表現”。

LAMDA是谷歌兩年前推出的一個對話型大語言模型,在今年2月還與Bard一同對外宣傳。該模型基於1.5萬億個令牌訓練。

隨著新的人工智能應用快速進入主流,圍繞底層技術的爭議也越來越激烈。

谷歌高級研究科學傢艾爾·邁赫迪·艾爾·麥哈麥迪(El Mahdi El Mhamdi)於今年2月辭職,主要原因就是人工智能技術缺乏透明度。本周二,OpenAI CEO山姆·阿爾特曼(Sam Altman)出席美國國會針對隱私和技術舉行的聽證會,他也認為需要設立一套新的制度來應對人工智能的潛在問題。

“對於一種全新的技術,我們需要一套全新的框架。”阿爾特曼說,“當然,像我們這樣的公司應當為我們推出的工具承擔許多責任。”


相關推薦

2023-07-16

博士、戴金權采訪 | 凌敏、李冬梅作者 | 凌敏算力是驅動人工智能產業發展的核心動力。在數據、算法和算力三大人工智能要素中,算力是將數據和算法真正通過硬件執行的基礎單元,並將數據、算法轉化為最終的生產力。隨著

2023-03-24

先笑一下,谷歌自己開發的人工智能工具,居然主張分拆谷歌阻止壟斷?在反壟斷的問題上,谷歌剛剛開放公測的生成式AI Bard相當地大義滅親。本周二,谷歌宣佈生成式AI Bard推出Beta測試版,逐步分批向註冊

2024-04-07

密相關的投資者目前正參與談判,希望協助馬斯克旗下的人工智能初創公司xAI募集到30億美元資金。此輪融資將使xAI的估值達到180億美元。風險投資公司Gigafund和馬斯克的老友、另一傢著名風險投資公司的聯合創始人史蒂夫·尤爾

2023-05-11

的 Google I/O 大會上宣佈的。開發者大會已經成為Google許多人工智能軟件和硬件能力的展示。在微軟將 OpenAI 的技術應用於 Bing 搜索和辦公生產力應用程序之後,Google加速其 AI 開發。該超級計算機面向希望訓練大型語言模型的客戶

2024-04-16

表示,隨著時間的推移,Google將花費超過1000億美元開發人工智能技術。Hassabis沒有透露更細節的投資規模,但表示:我們不談具體數字,但我想隨著時間推移,我們的投入會超過這個數。在Hassabis發表此番講話之際,Google的競爭

2023-04-04

出的原則。許多業內人士確實認為,像ChatGPT這樣強大的人工智能的確會對社會構成一定的傷害,但暫停6個月的開發似乎隻是一廂情願,幾乎沒有現實基礎。從OpenAI去年11月開始公測GPT-3以來,生成式人工智能開發的高速列車就從

2023-03-22

文檔、表格、會議、幻燈片等等生產力軟件中都將嵌入其人工智能模型。但是微軟方面也不甘示弱,也宣佈將ChatGPT的同源技術嵌入其旗下的辦公軟件中。可見在AI應用領域方面,白熱化的競爭已經來臨。

2022-10-22

知情人士稱,谷歌公司正在展開談判,擬向人工智能(AI)創業公司Cohere投資至少2億美元(約合14.5億元人民幣)。這再次表明,大型科技公司在AI領域的軍備競賽正在升級。Cohere成立於2019年,它所開發的自然語言處理軟件可被開發者

2023-02-10

本的對話聊天機器人,但其卻給用戶帶來令人耳目一新的人工智能體驗,也帶來諸多領域的落地應用前景。瑞士銀行分析師上周表示,ChatGPT很快就將達到1億月活用戶,打破TikTok保持的用戶破億增長速度。有趣的是,在ChatGPT上線

2023-02-25

參與研究,從而使這個領域更加大眾化。我們認為,整個人工智能社區——學術研究人員、民間社會、政策制定者和行業——必須共同努力,圍繞負責任的人工智能,特別是負責任的大型語言模型,制定明確的指導方針跟Google和

2023-02-06

之後,谷歌似乎也開始坐不住。當地時間周五,谷歌已向人工智能初創企業Anthropic投資約3億美元,後者正在測試ChatGPT的競爭產品。據解,通過這筆交易,谷歌將獲得Anthropic約10%的股份,後者要用這筆錢從前者的雲計算部門購買

2023-03-15

律師,隨手畫個草圖就能做出同款網頁。當國內還在熱議人工智能對話大模型產品ChatGPT時,背後核心預訓練模型技術GPT卻突然重磅升級。北京時間3月15日凌晨,創造出ChatGPT的美國 AI 公司OpenAI 正式對外發佈GPT-4。據悉,GPT-4是新

2023-02-25

。當地時間2月24日,Meta宣佈將推出針對研究社區的“Meta人工智能大型語言模型”系統(LargeLanguageModelMetaAI),簡稱“LLaMA”。同ChatGPT、New Bing不同,LLaMA並不是一個任何人都可以與之對話的產品,也並未接入任何Meta應用。更為

2023-11-04

進入智力時代11月1日,在英國倫敦佈萊奇利園舉辦的首屆人工智能安全峰會上,發佈《佈萊奇利宣言》,宣言稱 AI 帶來巨大機遇,有潛力增強人類福祉、和平和繁榮,但同時 AI 也帶來重大風險,而需要通過國際合作的形式解決