快科技3月31日消息,據媒體報道,OpenAI公司最近推出一項革命性的聲音克隆技術Voice Engine”。
據悉,Voice Engine通過文本輸入和15秒的音頻樣本,便能生成與原始說話者聲音極為相似、情感豐富且自然逼真的語音。
這一技術的研發始於2022年,並已應用於公司現有的文本轉語音API和Read Aloud功能中的預設語音。
OpenAI認為,Voice Engine技術對於多個領域具有重大意義。在閱讀輔助和語言翻譯方面,它能夠提供更為自然的語音輸出,增強用戶體驗。
同時,該技術對於言語障礙患者來說更是一大福音,能夠幫助他們更順暢地交流。例如,在佈朗大學的一個試點項目中,該技術成功用於創建從學校項目錄制的音頻中提取的語音克隆,有效幫助言語障礙學生。
然而,鑒於合成語音技術可能存在的濫用風險,OpenAI目前僅對少數可信合作夥伴開放小規模測試。通過這種方式,公司旨在深入解技術的潛在應用,並評估可能帶來的風險。
OpenAI也希望通過此舉引發社會對合成語音負責任部署的廣泛討論,共同探索如何適應這一新型技術。
此外,為確保技術的安全使用,OpenAI還采取一系列安全措施。這些措施包括使用水印技術追蹤音頻來源,以及對系統的使用方式進行主動監控。
當產品正式推向市場時,公司將設立一個禁止語音列表”,以檢測並阻止與名人聲音過於相似的人工智能生成聲音,從而避免潛在的版權和隱私問題。