8月31日消息,在本月的第86次AVS標準會議上,由騰訊天籟主導的AVS3語音編碼項目,已獲得顯著進展!
測試結果顯示,在純凈語音場景、網絡損傷場景等多場景下,能夠實現極低碼率下的高質量通話,向實現AVS3音頻標準落地更近一步!
本次AVS會議,騰訊側提交的技術方案,來自於騰訊首款自研神經網絡語音編解碼器Penguins。
傳統的語音編解碼器,包括AVS、ITU-T等標準語音編碼器,在碼率降低到10kbps以下時,語音質量下降明顯,影響用戶體驗。
為應對此挑戰,騰訊會議天籟實驗室聯合騰訊AI Lab,推出的騰訊首款自研神經網絡語音編解碼器Penguins。作為新一代的AI Codec,實現6kbps下的高質量通話,在主觀質量上也非常接近原始參考信號,媲美OPUS在20kbps的質量。
Penguins作為新一代AI codec,不僅能夠將編解碼效率提升300%,還充分考慮到用戶體驗與使用場景,盡可能地降低碼率和算力,維持與現有編碼器同等音質的同時,普惠更多的接入機型。當前,Penguins已經在騰訊會議(駕駛模式、弱網模式等)和QQ等多個產品中規模應用,支持億級用戶的順暢溝通。
此外,在網絡不佳時,Penguins會體現出極大的競爭力,比如降低網絡損傷情況下的卡頓率,提升通話的流暢度和清晰度等。
據解,AVS是國內多媒體領域最重要的標準化組織。2002年6月,國傢原信息產業部科學技術司批準成立數字音視頻編解碼技術標準工作組(AVS),面向我國的信息產業需求,聯合國內企業和科研機構,制(修)訂數字音視頻的壓縮、解壓縮、處理和表示等共性技術標準。其中,AVS音頻組負責組織制定音頻編碼技術標準。當前,AVS標準已經演進到第三代。