騰訊實時語音編碼大突破:電梯、地庫裡通話也不卡頓


快科技6月27日消息,騰訊宣佈,騰訊主導的新一代實時語音編碼行業標準AVS3P10,即將正式對外發佈。

由騰訊會議天籟實驗室攜手騰訊AI Lab研發的Penguins編解碼器(即AVS3P10行業標準的原型),把經典信號處理和最新的深度學習技術結合在一起,突破傳統編碼器的天花板

多方測試表明,騰訊提交的AVS3P10,代表目前AI Codec(人工智能編解碼器)的行業最高水平。

它可以實現碼率(每秒鐘傳輸的音頻數據量)6kbps以下的高質量通話。音頻質量,媲美行業現有主流標準在20kbps的質量。

騰訊表示,現在的實時語音編解碼技術,已經能在信號很差的情況下保證通話質量。你用騰訊會議,別說在電梯裡開會,就是在地庫裡,坐在高鐵裡穿過隧道時,都大概率不會卡頓。

據解,AVS3P10標準,原型是騰訊首款神經網絡語音編解碼器騰訊會議Penguins Al語音引擎,在穩定服務騰訊會議、QQ語音通話億級用戶後,開始用這項技術推動行業發展。


相關推薦

2023-09-01

8月31日消息,在本月的第86次AVS標準會議上,由騰訊天籟主導的AVS3語音編碼項目,已獲得顯著進展!測試結果顯示,在純凈語音場景、網絡損傷場景等多場景下,能夠實現極低碼率下的高質量通話,向實現AVS3音頻標準落地更近

2022-09-22

聲傳譯”業務,可以讓用戶在暢想高清視頻通話的同時,實時獲取不同語言互譯和字幕顯示所帶來的便捷,實現語言無障溝通。內容分享可以在通話時將音頻、視頻、圖片、位置、文本等內容分享給對方,通過更多樣化的方式幫

2022-09-25

。值得一提的是,研究團隊指出,雖然目前Whisper還沒有實時功能,但它的運行速度和內存大小表明,在這一基礎上搭建實時語音識別和翻譯功能是可行的。他們希望Whisper的高精度和易用性,將允許開發人員將語音接口添加到更

2023-07-22

快科技7月22日消息,AMD當前的銳龍7000系列還是Zen4架構,再往後就是Zen5,快的話今年底能發佈,慢的話也是2024年上市,初期是4nm工藝,後期升級3nm工藝。考慮到Zen4在IPC提升上略顯保守,Zen5架構的性能值得期待,同時AMD也要提升

2022-10-01

去年,Google宣佈用於低比特率的Lyra語音編解碼器,與開放的AV1編解碼器相結合,可以在20多年前的56kbps的Modem連接上實現語音聊天。Lyra利用機器學習和其他技術進行極低比特率的語音壓縮後,甚至可以在3kbps的速度下頑強工作。G

2022-07-20

在不同應用場景中是如何分工的呢?大核處理的自然都是實時、互動的高負載場景,都需要迅速的響應,比如3D表盤、應用滾動、視頻播放、3D地圖與導航、實時圖像識別、雙向視頻通話、智能終端控制、互動性語音助手。小核

2024-05-14

多模態輸入和輸出,包括語音、視頻、圖像和代碼,能夠實時與用戶進行無縫交流,理解情感,並展現出幽默個性。該模型的主要更新包括多語言支持,涵蓋50種語言,覆蓋90%的全球人口;性能提升,4oAPI的速度是turbo模型的兩倍

2023-03-23

iOS 16.4帶來很多新功能,除更加多樣化的表情之外,語音降噪可以說是提升使用體驗的大殺器。蘋果表示,語音降噪將優先處理您的聲音並屏蔽周圍的環境噪音,從而使電話通話更清晰,您可以更好地聽到您正在聊天的人,反之

2023-03-03

本於2020年7月面世,在圖像分塊、預測、變換、量化、熵編碼和環路濾波等環節提供先進工具,壓縮率再次提升一倍。值得一提的是,H.266/VVC標準制定中,繞不開阿裡科學傢葉琰博士,她隨後主導Ali266編解碼器的開發項目。得益

2023-01-11

出你的聲音。是不是細思極恐?這是微軟最新AI成果——語音合成模型VALL·E,隻需3秒語音,就能隨意復制任何人的聲音。它脫胎於DALL·E,但專攻音頻領域,語音合成效果在網上放出後火:有網友表示,要是將VALL·E和ChatGPT結合

2023-11-06

一直在投資人工智能。從 Apple Watch 的跌倒檢測到 iOS 17 的實時語音,人工智能都是這些功能的核心。不過,該公司正在將這項技術進一步整合到應用程序中,以實現更多功能。例如,生成式人工智能可以在信息應用和 Siri 中提供

2022-09-26

公開的行業大會上。在近期剛落下帷幕的美國科技界年度編碼大會(Code Conference)現場,匯聚一堂的矽谷科技巨頭、主流科技媒體,以及科技學術界精英們,不再專註於討論黑科技的問世,也沒有認真交流科技創新的進程,反而

2024-06-27

訊飛星火V4.0發佈會上,訊飛首次展示復雜場景下三人同時語音轉寫,效果震撼全場。在現場演示中,三位工作人員在嘈雜的環境中同時說話,每個人的語音都被訊飛星火準確識別,且同步轉寫成文字,準確率度極高,且互不幹

2023-02-06

密通信。簡單來說,量子密話”的原理是利用量子密鑰對語音信息進行高強度的加密。量子密鑰的生成是基於物理機制的量子真隨機性而非數學算法產生,是物理真隨機的。每通電話所使用的密鑰都不重復也沒有固定的規律。量