微軟推出一款名為DeepfakesCreator的工具,被稱為AzureAISpeech的文本到語音化身。這個工具可以通過文本輸入生成逼真的會說話的真人視頻。用戶隻需要上傳想要化身模仿的人的照片,並寫一個劇本,工具就能創建出逼真的人物化身視頻,模擬人物說話。
不僅如此,這個工具還支持多種語言,並能進行實時問答互動。此外,Deepfakes Creator還提供個性化語音功能,用戶隻需提供一分鐘的語音樣本,就能快速復制用戶的聲音,用於定制語音助手和內容配音。
項目地址:https://github.com/Azure/gen-cv/tree/main/avatar/video
為確保合法和倫理的使用,Deepfakes Creator禁止使用預錄制語音,並要求用戶明確同意使用並通過註冊使用特定的用例。另外,為辨認AI合成語音,工具會在個人語音中自動添加水印,並要求用戶同意Microsoft使用水印檢測服務。
Deepfakes Creator還可以簡化傳統視頻制作流程,適用於制作培訓視頻、產品介紹等各種內容。同時,它還可以用於構建對話代理、虛擬助手、聊天機器人等,提供自然的交互式對話。工具的內容生成工作流程包括文本分析、TTS音頻合成和TTS化身視頻合成,生成與聲音同步的嘴唇動畫。
除提供即用型的預構建化身,Deepfakes Creator還提供可定制化的化身選項。用戶可以通過上傳的視頻錄像進行訓練,定制出符合自己需求的化身。
為方便用戶使用,Azure AI Speech Studio提供UI工具和API訪問支持。Deepfakes Creator可以廣泛應用於創建各類吸引人的視頻和交互式應用,提高溝通和信息傳達的效率。