OpenAI推出聲音克隆新技術：復刻你的聲音僅需15秒

2024-04-01 來自快科技發表於業界精選

快科技3月31日消息，據媒體報道，OpenAI公司最近推出一項革命性的聲音克隆技術Voice Engine”。

據悉，Voice Engine通過文本輸入和15秒的音頻樣本，便能生成與原始說話者聲音極為相似、情感豐富且自然逼真的語音。

這一技術的研發始於2022年，並已應用於公司現有的文本轉語音API和Read Aloud功能中的預設語音。

OpenAI認為，Voice Engine技術對於多個領域具有重大意義。在閱讀輔助和語言翻譯方面，它能夠提供更為自然的語音輸出，增強用戶體驗。

同時，該技術對於言語障礙患者來說更是一大福音，能夠幫助他們更順暢地交流。例如，在佈朗大學的一個試點項目中，該技術成功用於創建從學校項目錄制的音頻中提取的語音克隆，有效幫助言語障礙學生。

然而，鑒於合成語音技術可能存在的濫用風險，OpenAI目前僅對少數可信合作夥伴開放小規模測試。通過這種方式，公司旨在深入解技術的潛在應用，並評估可能帶來的風險。

OpenAI也希望通過此舉引發社會對合成語音負責任部署的廣泛討論，共同探索如何適應這一新型技術。

此外，為確保技術的安全使用，OpenAI還采取一系列安全措施。這些措施包括使用水印技術追蹤音頻來源，以及對系統的使用方式進行主動監控。

當產品正式推向市場時，公司將設立一個禁止語音列表”，以檢測並阻止與名人聲音過於相似的人工智能生成聲音，從而避免潛在的版權和隱私問題。

相關推薦