Google發佈Lyra V2超低比特率語音編解碼器


去年,Google宣佈用於低比特率的Lyra語音編解碼器,與開放的AV1編解碼器相結合,可以在20多年前的56kbps的Modem連接上實現語音聊天。Lyra利用機器學習和其他技術進行極低比特率的語音壓縮後,甚至可以在3kbps的速度下頑強工作。Google去年開放Lyra的源碼,而今天他們宣佈LyraV2的可用性。

Google將Lyra V2總結為"一個更好、更快、更通用的語音編解碼器......一個新的架構,享有更廣泛的平臺支持,提供可擴展的比特率能力,具有更好的性能,並產生更高質量的音頻。"

Camp Compose (6).png

Lyra V2利用SoundStream端到端神經音頻編解碼器,繼續顯示出比Opus音頻編解碼器好得多的性能,改善音頻質量,以及更多。

Lyra V2的開源代碼今天已經可以使用。更多細節可以通過Google開源博客找到:

https://opensource.googleblog.com/2022/09/lyra-v2-a-better-faster-and-more-versatile-speech-codec.html

代碼可以在GitHub上找到:

https://github.com/google/lyra/releases/tag/v1.2.0

Lyra image 2.pngLyra image 3.png

GitHub的發佈說明提到Lyra V2在Android設備上的表現可以快上5倍,編解碼器的延遲從100毫秒減少到20毫秒,現在還支持Mac和Windows,以補充Linux和Android的支持。


相關推薦

2024-06-27

導的新一代實時語音編碼行業標準AVS3P10,即將正式對外發佈。由騰訊會議天籟實驗室攜手騰訊AI Lab研發的Penguins編解碼器(即AVS3P10行業標準的原型),把經典信號處理和最新的深度學習技術結合在一起,突破傳統編碼器的天花

2023-09-01

息,在本月的第86次AVS標準會議上,由騰訊天籟主導的AVS3語音編碼項目,已獲得顯著進展!測試結果顯示,在純凈語音場景、網絡損傷場景等多場景下,能夠實現極低碼率下的高質量通話,向實現AVS3音頻標準落地更近一步!本

2022-06-24

級耳機的語音通話質量,而這項功能預估將會裝備在即將發佈的AirPodsPro2上。正如 Twitter 用戶 George(通過 ShrimpApplePro)所發佈的,他通過其 beta 固件為 AirPods Max 啟用瞭 LC3 編解碼器。LC3 編解碼器是藍牙未來的低功耗和高質量編

2022-11-03

ot;有損壓縮的關鍵是識別人類無法察覺的變化,因為在低比特率下不可能實現完美的重建。為做到這一點,我們使用鑒別器來提高生成的樣本的感知質量。這就形成一個貓捉老鼠的遊戲,鑒別器的工作就是區分真實的樣本和重建

2024-02-28

rity 發佈的消息,兩名匿名人士透露消息稱,谷歌將通過 Google Play 系統更新將 Android 系統上的 AV1 編解碼器更換為 libdav1d,具體的更新時間大約在 2024 年 3 月前後。不過考慮到 Android 14 谷歌才強制要求 OEM 包含 AV1 編解碼器,因此

2022-09-23

Google正在向杜比全景聲和杜比全景聲發起沖擊。該公司希望引入兩種新的媒體格式,在一個新的消費者認可的品牌下提供HDR視頻和3D音頻,而不需要硬件制造商目前必須向杜比支付許可費。Google在今年早些時候與硬件制造商的一

2024-04-23

,參考AV1編碼器可實現比同類產品高得多的數據壓縮率。Google負責Android系統視頻和圖像編解碼器的經理阿裡夫-迪基奇(Arif Dikici)最近證實,移動操作系統將獲得一個基於軟件的官方 AV1 解碼器。這一全球最廣泛的移動平臺終於

2022-08-08

幾周後,蘋果將會舉辦備受期待的秋季新品發佈會。除已經確認iPhone14系列和AppleWatchSeries8系列之外,蘋果可能會推出其他很多新產品。國外科技媒體9to5Mac現在就開始盤點本次秋季發佈會上的新品內容。iPhone 14 系列今年 9 月發佈

2022-09-27

Google日前發佈AV13.5版本,這是該視頻編碼技術的最新版本,AV1有可能成為內容和媒體行業未來的主要參與者。在本次新版本中優化CPU編碼的效率,而且擴大硬件支持范圍。距離 2018 年 3 月首次發佈僅僅相隔 4 年時間,AOMedia Video 1

2023-03-20

和任何其他類型的無線耳機最大的問題之一是對各種音頻編解碼器的支持有限,許多人依賴不那麼好的SBC編解碼器或AAC,僅僅是因為這兩個代碼被耳機連接的大多數設備所支持。當涉及到智能手機時,高通公司是迄今為止最大的

2024-04-04

Google開源博客今天發佈用於編碼/解碼的JPEG編碼庫Jpegli,它與JPEG保持兼容,同時為高質量JPEG壓縮提供約35%的壓縮率改進。Jpegli的目標是成為比傳統JPEG處理更高效、更快速的JPEG編碼庫。Jpegli 的編碼和解碼符合原始的 JPEG 標準,

2022-07-08

自公司最初的編碼和解碼引擎 VCE 以來一直缺失。 AMD 在發佈帶有 Raven Ridge APU 和 RDNA 1 GPU 的 VCN 引擎後放棄這項技術。Tom's Hardware 表示:“B-frames 技術允許 H.264 壓縮算法從視頻流中的過去和未來幀預測圖像數據。它是一項可

2023-03-29

表中選擇QuickSync AV1。不幸的是,OBS還沒有確定新版本的發佈日期,但EposVox說它即將到來。他也計劃在未來的視頻中測試Discord的AV1流媒體功能。

2023-01-27

來自Google的研究人員發表一篇論文,稱他們創建一個從文本描述中生成高保真音樂的模型。它被稱為MusicLM,根據人工智能科學傢KeunwooChoi的說法,這個模型的整體結構是基於其他模型的,它結合MuLan+AudioLM和MuLan+w2b-Bert+Soundstream。