Google離建立其1000種語言的人工智能模型又近一步


當微軟和Google為誰的人工智能聊天機器人更好而使出渾身解數時,我們不難發現這並不是機器學習和語言模型的唯一用途。除傳聞中計劃在今年的年度GoogleI/O活動中展示20多種由人工智能驅動的產品外,Google正在朝著建立一個支持1000種不同語言的人工智能語言模型的目標邁進。

在周一發佈的更新中,Google分享有關通用語音模型(USM)的更多信息,Google稱這一系統是實現其目標的"關鍵第一步"。

image4.png

去年11月,該公司宣佈其計劃創建一個支持全球1000種最常用語言的語言模型,同時還披露其USM模型。Google將USM描述為"一個最先進的語音模型系列",它有20億個參數,在1200萬小時的語音和超過300種語言的280億個句子中進行訓練。

圖片.png

YouTube已經使用USM來生成封閉式字幕,它還支持自動語音識別(ASR),這可以自動檢測和翻譯語言,包括英語、中文普通話、阿姆哈拉語、宿務語、阿薩姆語等等。

image3.pngimage2.pngimage5.png

現在,Google USM支持超過100種語言,並將作為"基礎"來建立一個更加廣泛的系統。與此同時,Meta公司正在開發一個類似的人工智能翻譯工具,但目前仍處於早期階段。

您可以在Google發佈的研究論文中閱讀更多關於USM和它如何工作的信息:

https://arxiv.org/abs/2303.01037

該技術的一個目標可能是在增強現實的眼鏡內,就像Google去年在I/O活動中展示的概念一樣,能夠檢測並提供實時翻譯,不過,這項技術似乎還有點遙遠,Google在I/O大會期間對阿拉伯語的錯誤表述證明它是多麼容易出錯。


相關推薦

2022-11-02

一目標的第一步,該公司公佈一個經過400多種語言訓練的人工智能模型,它將其描述為"今天在一個語音模型中看到的最大的語言覆蓋范圍"。語言和人工智能可以說一直是Google產品的核心,但最近機器學習的

2022-12-21

上宣佈的,同時Google還努力創建"一個單一的、統一的人工智能模型,將能夠處理超過100種印度語言的語音和文本"。這並不是Google為支持多語言用戶所采取的第一步。例如,Gboard已經支持印地英語,用戶可以在設備上配置

2022-09-22

強大的語音識別系統置於其軟件和服務的核心地位。但在人工智能和機器學習領域,語音識別仍是一個頗具挑戰性的話題。好消息是,今日OpenAI隆重地宣佈Whisper的開源——可知作為一套自動語音識別系統,官方宣稱它能夠實現

2023-02-13

過Google翻譯和DeepL Translate。這表明,ChatGPT本質上是一個人工智能對話工具,能夠比商業翻譯軟件生成更自然的口語(見圖6)。圖6:來自WMT20魯棒集set3的例子2ChatGPT應如何揚長避短?從該研究可知,高舉高打的ChatGPT每訓練一次就

2023-03-22

繼OpenAI發佈ChatGPT、百度發佈文心一言後,終於,Google宣佈將其自傢的對話式AI服務Bard開放內測!Bard是一個獨立的網頁,尚處在實驗階段,官網左上角標註有“Experiment”,目前僅對美國和英國地區開放測試,並將逐步擴展到更多

2024-02-02

、泰盧固語和馬拉雅拉姆語。12 月,Google推出新的生成式人工智能模型,包括旗艦版 Gemini Ultra、"精簡版"Gemini Pro和專為在 Pixel 8 等設備上運行而設計的 Gemini Nano。與此同時,該公司還更新 Bard 與 Gemini Pro 的英語對話。Goog

2022-08-27

子將它高速地推向打手。但這裡有很多潛在的創新空間。人工智能、統計跟蹤、先進的指標和機器人技術的進步可以很好地結合在一起,對經典進行適當的,更21世紀的改變。Trajekt Arc就是一個這樣的投球機器人,旨在學習和重

2023-03-15

律師,隨手畫個草圖就能做出同款網頁。當國內還在熱議人工智能對話大模型產品ChatGPT時,背後核心預訓練模型技術GPT卻突然重磅升級。北京時間3月15日凌晨,創造出ChatGPT的美國 AI 公司OpenAI 正式對外發佈GPT-4。據悉,GPT-4是新

2023-05-11

快科技5月11日消息,谷歌年度開發者大會Google I/O 2023上,PaLM 2大模型正式發佈,準備向OpenAI的GPT-4等競爭對手發起挑戰。據解,PaLM 2是谷歌首個從頭開始構建的多模態模型,具有不同規模的高度能力,並能有效地與其他工具和API

2022-09-30

Google旗下的語音引擎SpeechServices近日獲得升級,在改善語音清晰度之外,Android應用在調用該服務的時候能夠讓文本轉語音聽起來更加自然。在Android開發者博文中,Google還放出升級前後兩者之間文本轉語音對比。國外科技媒體 The

2022-09-25

有一個靠譜的語音識別系統能聽懂我的口音。前任特斯拉人工智能總監Andrej Karpathy甚至轉發評論:OpenAI正處於最好的狀態中。話不多說,讓我們看看這個被“好評如潮”的語音系統究竟是怎麼回事。逼近人類水平的語音識別系統

2023-11-14

於芬蘭赫爾辛基,推出Poro,旨在提升歐洲語言的多語言人工智能能力。2. 🤖 Poro是首個計劃覆蓋歐盟所有24種官方語言的開源模型,由Silo AI的SiloGen和圖爾庫大學的TurkuNLP研究小組開發。3. 🌍 Poro使用跨語言訓練方法,利用來自

2023-05-11

皮柴登場,幾句簡單的寒暄後他直擊主題,“眾所周知,人工智能今年非常忙碌,而作為一傢 AI-first 公司,我們有很多話要談。所以,讓我們開始吧。”Gmail、Maps等AI升級,創造更智能的生活體驗活動的一開始,Google先上幾個“

2023-03-10

的東西對翻譯工具也會有很大的幫助。Braun將GPT-4描述為人工智能領域的遊戲規則改變者,它將向著擁有人類的解釋能力這一目標更進一步。顯然,網友對GPT-4的發佈充滿期待。有網友還做一張GPT-4和GPT-3參數對比圖。OpenAI創始人Sa