Meta的AI翻譯器可以解釋無文字的語言 紮克伯格以閩南話舉例


世界上大約7000種已知的語言中,有將近一半的語言,也就是其中的十分之四是口耳相傳,沒有包含書面內容。這些無文字的語言給現代機器學習翻譯系統帶來一個獨特的問題,因為它們通常需要在翻譯到新語言之前將口頭語言轉換為書面文字,並將文字還原為語音,但Meta公司已經通過其最新的開源語言AI進展解決這個問題。

634b8d4d410f430018147659.webp

作為Meta公司通用語音翻譯器(UST)項目的一部分,該項目正致力於開發實時語音到語音的翻譯,以便元宇宙居民能夠更容易地進行互動(讀作:互相進行性騷擾)。作為這個項目的一部分,Meta的研究人員研究福建閩南話,這是一種散居在亞洲各地的無文字語言,也是臺灣地區的主流語言之一。

機器學習翻譯系統通常需要大量可標記的語言例子,包括書面和口語來進行訓練--這正是像閩南話這樣的無文字語言所不具備的。為解決這個問題,"Meta使用語音到單元的翻譯(S2UT),將輸入的語音直接轉換為Meta以前開創的聲學單元序列,"首席執行官馬克-紮克伯格在周三的一篇博文中解釋說。"然後,我們從這些單元生成波形。此外,UnitY被采用為雙通解碼機制,第一通解碼器生成相關語言(普通話)的文本,第二通解碼器創建單元。"

"我們利用普通話作為中間語言來建立偽標簽,我們首先將英語(或上面說的閩南話)語音翻譯成普通話文本,然後我們再翻譯成閩南話(或英語)並將其加入訓練數據。"目前,該系統允許講福建話的人與講英語的人交談,盡管很生硬,且該模型一次隻能翻譯一個完整的句子。但紮克伯格相信,這項技術最終可以應用於更多語言,並將改進到提供實時翻譯的程度。

紮克伯格宣佈,除Meta已經從這個項目中開源的模型和訓練數據外,該公司還將發佈一個基於閩南話話語料庫的首個語音翻譯基準系統,以及"語音矩陣,一個用Meta的創新數據挖掘技術LASER挖掘的語音翻譯大料庫"。這個系統將使研究人員能夠創建他們自己的語音到語音翻譯(S2ST)系統。


相關推薦

2024-03-14

索結果、標簽、自定義 alt 文本、"關註"選項卡、翻譯以及刪除 Threads 個人檔案的功能。

2023-04-25

個季度的財報,投資者將密切關註公司支出和投資計劃。可以肯定的是,人工智能會對Meta核心廣告和社交媒體業務有所幫助,而元宇宙業務會有重大轉變。Meta首席運營官哈維爾·奧利文(Javier Olivan)最近在摩根士丹利主辦的一次

2023-02-28

品體驗。紮克伯格表示,Meta的長遠目標是開發AI機器人,可以通過各種方式給消費者提供幫助,但是在目前的階段,Meta正在開發有關文字(即有關旗下兩大移動聊天工具WhatsApp和Messenger)、圖片(比如Instagram中創意性特效和廣告

2024-04-25

括網頁界面、倒序搜索、標簽、"關註"標簽、語言翻譯等。

2022-07-15

的代碼條目,類似於拼圖片;然後將一個給定的文本提示翻譯成這些代碼條目並創建一個新的圖像。雖然這些系統可以創建向其描述的大多數東西,但用戶對輸出圖像的具體方面沒有任何控制。“為實現AI推動創造性表達的潛力

2022-11-02

模型能夠完成許多任務,從語言生成(如OpenAI的GPT-3)到翻譯(見Meta的"不遺漏語言"工作)。Google的"1000種語言計劃"並不專註於任何特定的功能,而是要創建一個具有世界上各種語言的巨大知識廣度的單一系統。Go

2023-02-08

聊天機器人和其他生成式 AI 技術時,LeCun博士表示,它們可以幫助企業在Facebook上制作廣告,並稱一旦人們進入元宇宙,他們將需要生成式AI來創建虛擬物品。媒體分析認為,Meta如何將AI技術轉化成產品成現在該公司面臨的重要

2022-09-17

戴設備,例如一個腕帶。腕帶在接收到信號後,可以將其翻譯成特定的指令。紮克伯格所描繪的這種願景更接近於普通人的現實生活,但他同樣沒有給出實現這些願景的時間表。人類在探索腦機接口技術的途中還有很多未知,不

2024-02-08

易的獲取 IDFA (廣告標識),做到精準的廣告推薦,但你可以購買蘋果的搜索廣告,讓你的 APP 永遠出現在 APP Store 的搜索框旁邊。蘋果搜索廣告的位置示意,圖片來自蘋果公司官網這是一種從上遊把控用戶入口後的特權,蘋果

2022-08-08

嘻嘻,心裡……而AI聊天機器人遇到這種情況的時候,就可以隨心所欲做自己。面對網友評論紮克伯格的要求,BlenderBot3瘋狂diss老板——“不道德”“是個壞人”“令人毛骨悚然,還控制欲超強”。而對於圖靈獎得主,Meta首席人

2024-03-27

。Meta已表示Llama 2可免費用於研究和商業用途,開發者們可以直接在Llama 2官方網站下載該模型。紮克伯格在去年的一次財報電話會議上對投資者表示,“就投資重點而言,人工智能將是我們2024年在工程和計算資源方面最大的投

2023-04-26

T推出後的幾個月裡,這項工作加速。(易句)(本文由AI翻譯,網易編輯負責校對)

2023-02-25

在人工智能(AI)領域的工作。“大型語言模型”(LLM)可以消化大量的文本數據,並推斷文本的單詞之間的關系。隨著計算能力的進步,以及輸入數據集與參數空間的不斷擴大,LLM的能力也相應提高。目前,LLM已經被證明能高

2022-06-23

字錢包。我們將邁出第一步,把Facebook Pay改為Meta Pay。你可以通過Facebook、 Instagram、WhatsApp、Messenger以及任何其他支持Facebook Pay的平臺使用Meta Pay,用戶購物、轉賬以及捐贈的方式都不變。但除瞭現有功能之外,我們還在開發一些