騰訊實時語音編碼大突破：電梯、地庫裡通話也不卡頓

2024-06-27 來自快科技發表於業界精選

快科技6月27日消息，騰訊宣佈，騰訊主導的新一代實時語音編碼行業標準AVS3P10，即將正式對外發佈。

由騰訊會議天籟實驗室攜手騰訊AI Lab研發的Penguins編解碼器（即AVS3P10行業標準的原型），把經典信號處理和最新的深度學習技術結合在一起，突破傳統編碼器的天花板。

多方測試表明，騰訊提交的AVS3P10，代表目前AI Codec（人工智能編解碼器）的行業最高水平。

它可以實現碼率（每秒鐘傳輸的音頻數據量）6kbps以下的高質量通話。音頻質量，媲美行業現有主流標準在20kbps的質量。

騰訊表示，現在的實時語音編解碼技術，已經能在信號很差的情況下保證通話質量。你用騰訊會議，別說在電梯裡開會，就是在地庫裡，坐在高鐵裡穿過隧道時，都大概率不會卡頓。

據解，AVS3P10標準，原型是騰訊首款神經網絡語音編解碼器騰訊會議Penguins Al語音引擎，在穩定服務騰訊會議、QQ語音通話億級用戶後，開始用這項技術推動行業發展。

相關推薦

騰訊又立功主導AVS3語音編碼新進展：網絡不佳通話依舊流暢

2023-09-01

8月31日消息，在本月的第86次AVS標準會議上，由騰訊天籟主導的AVS3語音編碼項目，已獲得顯著進展！測試結果顯示，在純凈語音場景、網絡損傷場景等多場景下，能夠實現極低碼率下的高質量通話，向實現AVS3音頻標準落地更近

中興與運營商合推5G新通話：4K高清視頻自帶“主叫名片”

2022-09-22

聲傳譯”業務，可以讓用戶在暢想高清視頻通話的同時，實時獲取不同語言互譯和字幕顯示所帶來的便捷，實現語言無障溝通。內容分享可以在通話時將音頻、視頻、圖片、位置、文本等內容分享給對方，通過更多樣化的方式幫

能聽懂口音的開源語音系統來：OpenAI出品支持99種語言

2022-09-25

。值得一提的是，研究團隊指出，雖然目前Whisper還沒有實時功能，但它的運行速度和內存大小表明，在這一基礎上搭建實時語音識別和翻譯功能是可行的。他們希望Whisper的高精度和易用性，將允許開發人員將語音接口添加到更

大腦中的大腦 AMD Zen5微代碼大改：容量上限大漲近兩倍

2023-07-22

快科技7月22日消息，AMD當前的銳龍7000系列還是Zen4架構，再往後就是Zen5，快的話今年底能發佈，慢的話也是2024年上市，初期是4nm工藝，後期升級3nm工藝。考慮到Zen4在IPC提升上略顯保守，Zen5架構的性能值得期待，同時AMD也要提升

Google發佈Lyra V2超低比特率語音編解碼器

2022-10-01

去年，Google宣佈用於低比特率的Lyra語音編解碼器，與開放的AV1編解碼器相結合，可以在20多年前的56kbps的Modem連接上實現語音聊天。Lyra利用機器學習和其他技術進行極低比特率的語音壓縮後，甚至可以在3kbps的速度下頑強工作。G

4nm+22nm雙工藝高通發佈驍龍W5+驍龍W5可穿戴平臺：輕松續航3天

2022-07-20

在不同應用場景中是如何分工的呢？大核處理的自然都是實時、互動的高負載場景，都需要迅速的響應，比如3D表盤、應用滾動、視頻播放、3D地圖與導航、實時圖像識別、雙向視頻通話、智能終端控制、互動性語音助手。小核

人工客服要被取代？用GPT-4o模擬處理客服事務，100%流暢毫無AI味

2024-05-14

多模態輸入和輸出，包括語音、視頻、圖像和代碼，能夠實時與用戶進行無縫交流，理解情感，並展現出幽默個性。該模型的主要更新包括多語言支持，涵蓋50種語言，覆蓋90%的全球人口;性能提升，4oAPI的速度是turbo模型的兩倍

iOS 16.4大殺器：多個app支持降噪

2023-03-23

iOS 16.4帶來很多新功能，除更加多樣化的表情之外，語音降噪可以說是提升使用體驗的大殺器。蘋果表示，語音降噪將優先處理您的聲音並屏蔽周圍的環境噪音，從而使電話通話更清晰，您可以更好地聽到您正在聊天的人，反之

完爆H.265！優酷用上H.266編解碼：最便宜手機放視頻也絲般順滑

2023-03-03

本於2020年7月面世，在圖像分塊、預測、變換、量化、熵編碼和環路濾波等環節提供先進工具，壓縮率再次提升一倍。值得一提的是，H.266/VVC標準制定中，繞不開阿裡科學傢葉琰博士，她隨後主導Ali266編解碼器的開發項目。得益

3秒復制任何人的嗓音微軟音頻版DALL·E連環境背景音也能模仿

2023-01-11

出你的聲音。是不是細思極恐？這是微軟最新AI成果——語音合成模型VALL·E，隻需3秒語音，就能隨意復制任何人的聲音。它脫胎於DALL·E，但專攻音頻領域，語音合成效果在網上放出後火：有網友表示，要是將VALL·E和ChatGPT結合

蘋果大力投資生成式AI 三星則尋求微軟ChatGPT和Google Bard的幫助

2023-11-06

一直在投資人工智能。從 Apple Watch 的跌倒檢測到 iOS 17 的實時語音，人工智能都是這些功能的核心。不過，該公司正在將這項技術進一步整合到應用程序中，以實現更多功能。例如，生成式人工智能可以在信息應用和 Siri 中提供

矽谷巨頭集體批鬥TikTok的“科技峰會”，折射出什麼問題？

2022-09-26

公開的行業大會上。在近期剛落下帷幕的美國科技界年度編碼大會（Code Conference）現場，匯聚一堂的矽谷科技巨頭、主流科技媒體，以及科技學術界精英們，不再專註於討論黑科技的問世，也沒有認真交流科技創新的進程，反而

遙遙領先！訊飛首次實現三人同時語音轉寫：確率度極高互不幹擾

2024-06-27

訊飛星火V4.0發佈會上，訊飛首次展示復雜場景下三人同時語音轉寫，效果震撼全場。在現場演示中，三位工作人員在嘈雜的環境中同時說話，每個人的語音都被訊飛星火準確識別，且同步轉寫成文字，準確率度極高，且互不幹

《流浪地球2》裡的“硬核科技” 中國電信已經用上

2023-02-06

密通信。簡單來說，量子密話”的原理是利用量子密鑰對語音信息進行高強度的加密。量子密鑰的生成是基於物理機制的量子真隨機性而非數學算法產生，是物理真隨機的。每通電話所使用的密鑰都不重復也沒有固定的規律。量

熱門推薦