微軟推出文本轉真人視頻工具Deepfakes Creator

2023-11-17 發表於業界精選

微軟推出一款名為DeepfakesCreator的工具，被稱為AzureAISpeech的文本到語音化身。這個工具可以通過文本輸入生成逼真的會說話的真人視頻。用戶隻需要上傳想要化身模仿的人的照片，並寫一個劇本，工具就能創建出逼真的人物化身視頻，模擬人物說話。

不僅如此，這個工具還支持多種語言，並能進行實時問答互動。此外，Deepfakes Creator還提供個性化語音功能，用戶隻需提供一分鐘的語音樣本，就能快速復制用戶的聲音，用於定制語音助手和內容配音。

項目地址:https://github.com/Azure/gen-cv/tree/main/avatar/video

為確保合法和倫理的使用，Deepfakes Creator禁止使用預錄制語音，並要求用戶明確同意使用並通過註冊使用特定的用例。另外，為辨認AI合成語音，工具會在個人語音中自動添加水印，並要求用戶同意Microsoft使用水印檢測服務。

Deepfakes Creator還可以簡化傳統視頻制作流程，適用於制作培訓視頻、產品介紹等各種內容。同時，它還可以用於構建對話代理、虛擬助手、聊天機器人等，提供自然的交互式對話。工具的內容生成工作流程包括文本分析、TTS音頻合成和TTS化身視頻合成，生成與聲音同步的嘴唇動畫。

除提供即用型的預構建化身，Deepfakes Creator還提供可定制化的化身選項。用戶可以通過上傳的視頻錄像進行訓練，定制出符合自己需求的化身。

為方便用戶使用，Azure AI Speech Studio提供UI工具和API訪問支持。Deepfakes Creator可以廣泛應用於創建各類吸引人的視頻和交互式應用，提高溝通和信息傳達的效率。

相關推薦