Google升級Speech Service引擎:67種語言421種聲音更清晰更自然


Google旗下的語音引擎SpeechServices近日獲得升級,在改善語音清晰度之外,Android應用在調用該服務的時候能夠讓文本轉語音聽起來更加自然。在Android開發者博文中,Google還放出升級前後兩者之間文本轉語音對比。

orp67sku.webp

國外科技媒體 The Verge 坦率地表示,雖然聲音聽起來更加得清晰,但是更加自然這點上是持懷疑態度的。該媒體表示仍然很難確定這些美國英語錄音中的第一句話實際上說的是什麼。

系統內 67 種語言的所有 421 種聲音都獲得新的聲音模型和合成器。 “English-US”中當前的默認語音正在更改為使用“更新鮮的說話者數據”構建的語音,與其他更新一起,與之前的默認語音相比有明顯的改進。您還可以收聽“西班牙語-美國”和“巴西-葡萄牙語”等語言中更新後的聲音。


相關推薦

2024-02-21

,蘋果正在用其大型語言模型訓練Siri,以使其更好地與Google Assistant等競爭。目前,與Google Assistant相比,iPhone上的Siri在理解上下文方面存在困難。隨著即將到來的生成式人工智能的增強,Siri可以提供更強大的體驗。在2月早些時

2024-03-23

類似Siri那樣的個人助理產品。盡管這是商標申請,但是Google前雇員透露的信息以及上個月泄露的OpenAI正在開發的Agent產品都似乎印證著OpenAI要做的事情:開發一個全球最強的個人助理,接管個人設備,以Jarvis那樣的形式提供服務

2022-12-21

Google正在改進Google搜索以兩種語言呈現信息的方式,同時開發其語音搜索功能,以理解使用混合語言的查詢。在印度的印地語地區,知識圖譜框中的搜索結果以及"熱門故事"和"人們也在問"

2023-05-11

5月10日周三舉行的Google年度開發者大會GoogleI/O2023上,Google亮出人工智能(AI)領域開發的最新成果。和此前媒體曝光的消息一致,本次Google正式發佈新的通用大語言模型PaLM2。PaLM2是驅動AI機器人Bard的模型的升級版,可以生成多

2023-11-17

微軟推出一款名為DeepfakesCreator的工具,被稱為AzureAISpeech的文本到語音化身。這個工具可以通過文本輸入生成逼真的會說話的真人視頻。用戶隻需要上傳想要化身模仿的人的照片,並寫一個劇本,工具就能創建出逼真的人物化身

2023-05-11

級後的bard還支持多種語言,並可以將生成的內容導出到google docs和gmail。此次升級反映谷歌對人工智能聊天機器人的持續投資,以及其改善自然語言處理和視覺搜索能力的努力。這也凸顯人工智能聊天機器人與其他應用和服務集

2023-01-27

便下載和流媒體功能。繼承Signature Walkman的理念,NW-ZX707升級微調電容和FTCAP3(高聚物電容)以及大型固體高聚物電容,提供大電容和低電阻。而覆蓋數字塊的OFC(無氧銅)銑削塊,使NW-ZX707的聲音更純凈,此外,用於平衡輸出的

2024-02-28

Windows11Moment5更新現已發佈,其中包含大量升級,但並非所有升級都以Copilot為中心。雖然下一個版本升級24H2仍在開發中,但Moment5為你提供微小但實用的功能升級和對原生應用的改進。您可以前往"設置">"更新"並

2023-01-14

名度不斷提高,在大型科技公司中贏得新的支持者。甚至Google現在也在考慮在其Chrome瀏覽器中整合這種新的(類似)語言。Rust是由Mozilla贊助和支持的,作為建立一個新的、更安全和性能更好的網絡瀏覽器的方法。現在,Google將

2023-12-07

晚舉行小米澎湃OS體驗溝通會,新系統字體MiSans進行全面升級。據介紹,MiSans具有超大生僻字庫,總計87887字符,新增生僻字鍵盤,百度輸入法小米版、訊飛輸入法小米版、搜狗輸入法小米版均已適配生僻字。同時,小米還帶來Mi

2023-02-23

本月早些時候,Google宣佈計劃推出Bard,這是一個人工智能,聊天機器人旨在通過自然語言模型幫助用戶尋找信息。微軟也宣佈新的必應搜索,它自己的聊天機器人結合微軟的技術和OpenAI的技術,後者是ChatGPT背後的公司。然而,

2022-12-23

橫空出世,讓Pichai真的怕。沒有大力發展聊天機器人,是Google的戰略性失誤嗎?這個月,OpenAI的ChatGPT橫空出世,立刻在AI圈掀起一股大風暴。清晰、智能、循循善誘,甚至能包辦論文和代碼。當時許多人就預言:Google恐怕藥丸。

2022-07-18

的《鳥》創造陰森的鳥聲。為紀念他對電子音樂的貢獻,Google將在周一薩拉的112歲生日時將其塗鴉獻給他。薩拉1910年出生於德國東部小鎮格賴茨,年輕時就沉浸在音樂中,在青年時期學習風琴和鋼琴。1930年,他迷上trautonium(特

2022-09-25

github.com/openai/whisper#approach參考鏈接:[1]https://colab.research.google.com/github/openai/whisper/blob/master/notebooks/LibriSpeech.ipynb[2]https://techcrunch.com/2022/09/21/openai-open-sources-whisper-a-multilingual-speech-recognition-system/?guccounter[3]https://news.ycombinator.com/item