微軟推出文本轉真人視頻工具Deepfakes Creator


微軟推出一款名為DeepfakesCreator的工具,被稱為AzureAISpeech的文本到語音化身。這個工具可以通過文本輸入生成逼真的會說話的真人視頻。用戶隻需要上傳想要化身模仿的人的照片,並寫一個劇本,工具就能創建出逼真的人物化身視頻,模擬人物說話。

不僅如此,這個工具還支持多種語言,並能進行實時問答互動。此外,Deepfakes Creator還提供個性化語音功能,用戶隻需提供一分鐘的語音樣本,就能快速復制用戶的聲音,用於定制語音助手和內容配音。


項目地址:https://github.com/Azure/gen-cv/tree/main/avatar/video

為確保合法和倫理的使用,Deepfakes Creator禁止使用預錄制語音,並要求用戶明確同意使用並通過註冊使用特定的用例。另外,為辨認AI合成語音,工具會在個人語音中自動添加水印,並要求用戶同意Microsoft使用水印檢測服務。

Deepfakes Creator還可以簡化傳統視頻制作流程,適用於制作培訓視頻、產品介紹等各種內容。同時,它還可以用於構建對話代理、虛擬助手、聊天機器人等,提供自然的交互式對話。工具的內容生成工作流程包括文本分析、TTS音頻合成和TTS化身視頻合成,生成與聲音同步的嘴唇動畫。

除提供即用型的預構建化身,Deepfakes Creator還提供可定制化的化身選項。用戶可以通過上傳的視頻錄像進行訓練,定制出符合自己需求的化身。

為方便用戶使用,Azure AI Speech Studio提供UI工具和API訪問支持。Deepfakes Creator可以廣泛應用於創建各類吸引人的視頻和交互式應用,提高溝通和信息傳達的效率。


相關推薦

2023-03-23

owerPoint和Excel。微軟21日發佈的最新工具命名為“Bing Image Creator”,將允許必應(Bing)和Microsoft Edge瀏覽器的用戶使用OpenAI的DALL-E創建文本提示圖像,用戶可以通過語言文字生成圖像,例如要求畫一張“宇航員穿過向日葵星系”

2022-10-12

過Edge側邊欄上的圖像創造者圖標來訪問該功能。Bing Image Creator接下來我們來看一個與微軟的收件箱視頻編輯器Clipchamp有關的發佈。該工具現在是微軟365應用程序系列的一部分,當涉及到視頻編輯任務時,它將是Designer的補充。Cli

2023-02-25

誤,隨之股價下跌。不僅如此,微軟的必應也容易出錯。Deepfakes正被用來騷擾人們或傳播錯誤信息。包括Stability AI在內的公司正面臨來自藝術傢和版權所有者的訴訟,這些人反對未經許可使用他們的作品來訓練AI模型。TIME的一項

2024-05-10

,而新版畫圖應用則對圖像創建者進行更名,原本名為Cocreator,新名稱為ImageCreator。這些新版本僅面向開發和金絲雀通道的用戶推送,當然 Windows 11 正式版用戶如果想要安裝也是可以的,直接獲取離線安裝包部署即可。其中截圖

2024-09-06

大會發佈全新系列的Yoga和IdeaPad筆記本電腦。其中,聯想Creator Zone成為備受關註的AI PC明星級應用程序。聯想Creator Zone是一款設備本地應用程序,它利用自然語言處理技術來生成和編輯圖像,由經過精細優化的Stable Diffusion 3.0 AI模

2023-12-07

品是由人工智能生成的--特別是考慮到加沙戰爭中大量的Deepfakes和繞過過濾器的人工智能生成的虐童圖片。最近,中國國傢互聯網信息辦公室發佈規定,要求人工智能生成器廠商在不影響用戶使用的情況下,對生成的內容(包括

2022-11-11

。文字轉圖像正迅速成為創意平臺的主力,就在上個月,微軟推出自己的文字轉圖像工具Microsoft Designer(由OpenAI的DALL-E系統驅動),作為其Office套件的一部分。這些系統的興起也引發一些爭議,特別是它們使用受版權保護的圖像

2022-12-21

人員們也早已意識到其可能帶來的危害。比如當Google宣佈推出Imagen、Dreambooth時,在解釋文檔中都避免使用真人的照片,而是用物品和可愛的動物的圖片舉例進行說明。不僅是Google,DallE等同類工具也無一不是如此。對此,麻省理

2023-02-23

開始在部分國傢和地區的新版Bing中,加入圖像創建器ImageCreator的相關功能。Image Creator是微軟推出的一項AI服務,它基於OpenAI的DALL-E人工智能圖像生成技術,能夠根據用戶的文本描述,自動生成與之相關的圖像。根據用戶Khushal Bhe

2024-03-27

免有些過於炫酷。Arcads表示自己是由AI驅動的工具,可將文本轉換為高質量、能引起情感共鳴的視頻廣告。它使用先進的AI算法來生成真實、逼真的視頻,而用戶隻需要輸入文本即可。從效果上來看,確實跟前面那個爆火的視頻

2023-11-23

關民事訴訟的企業客戶予以賠償。今年9月,Adobe和谷歌、微軟在內的7傢人工智能頭部公司還簽署白宮發起的一項自願性承諾,承諾給人工智能代碼加水印。風險提示及免責條款市場有風險,投資需謹慎。本文不構成個人投資建

2024-03-23

OpenAI申請商標VoiceEngine,暗示著OpenAI可能即將推出圍繞語音引擎開發的產品或者服務,很有可能是類似Siri那樣的個人助理產品。OpenAI正在申請一個新商標VoiceEngine,商標的覆蓋范圍主要是圍繞語音識別、語音合成和語音生成幾個

2024-02-16

OpenAI正在推出一種新的視頻生成模型,它的名字叫Sora。這傢人工智能公司稱,Sora"可以根據文字說明創建逼真而富有想象力的場景"。文本到視頻模式允許用戶根據自己編寫的提示創建長達一分鐘的逼真視頻。

2024-02-20

測工具,但因為檢測錯誤率太高偷偷給下架……兩年前,微軟還有 BBC 等幾傢科技公司和媒體一起合作,成立個內容來源和真實性聯盟 ( C2PA ) 。有 C2PA 協議之後,內容是誰創作的,歷史的修改記錄,都會被記錄下來。就相當於給