[圖]Meta推出Make-A-Video工具:隻需簡單文本就可創建短視頻


通過Dall-E、Midjourney和CrAIyon等AI工具,普通用戶也可以輸入一些簡單的文本內容,經過人工智能加工之後生產媲美藝術傢的藝術插圖。而Meta最新推出的Make-A-Video工具則讓AI藝術生成工具更近一步,隻要一些簡單的文字就可以生成視頻。

ezgif.com-gif-maker.webp

結果令人印象深刻且多種多樣,而且毫無例外地都有些令人毛骨悚然。我們以前見過文本到視頻模型——它是文本到圖像模型(如 DALL-E)的自然擴展,它從提示中輸出靜止圖像。但是,雖然從靜止圖像到移動圖像的概念跳躍對於人類大腦來說很小,但在機器學習模型中實現卻絕非易事。

例如輸入“A dog wearing a Superhero outfit with red cape flying through the sky”,就會生成下面短視頻:

例如“A teddy bear painting a portrait”,就會生成

A_teddy_bear_painting_a_portrait.webp

Meta 的研究人員表示,僅文本輸入生成圖像的模型在生成短視頻方面同樣有效。AI 使用現有的有效擴散技術來創建圖像,該技術本質上是從純視覺靜態“去噪”到目標提示的反向工作。這裡要補充的是,該模型還對一堆未標記的視頻內容進行無監督訓練(也就是說,它在沒有人類強烈指導的情況下檢查數據本身)。

Meta 的研究人員寫道:“在空間和時間分辨率、對文本的忠實度和質量的所有方面,Make-A-Video 設置文本到視頻生成的最新技術水平,由定性和定量測量決定”。


相關推薦

2022-08-21

於人工智能的模型Transformer的點贊。Transformer最初於2017年推出,是一個新穎的神經網絡架構,它有能力通過建模和比較句子中的其他詞來生成文本。此後,該模型被納入標準的深度學習框架如TensorFlow和PyTorch。據悉,Transframer使用

2022-10-07

柴哥接連派出兩名選手上場競爭。第一位ImagenVideo與Meta的Make-A-Video相比突出一個高清,能生成1280*768分辨率、每秒24幀的視頻片段。另一位選手Phenaki,則能根據200個詞左右的提示語生成2分鐘以上的長鏡頭,講述一個完整的故事。

2022-10-08

生成AI來個超進化。這回是真能“用嘴做視頻”:AI名為Make-A-Video,直接從DALL·E、Stable Diffusion搞火的靜態生成飛升動態。給它幾個單詞或幾行文字,就能生成這個世界上其實並不存在的視頻畫面,掌握的風格還很多元。不僅紀錄

2022-10-06

繼日前Meta宣佈Make-A-Video之後,Google今天宣佈ImagenVideo人工智能系統,可以根據簡短文本內容(例如泰迪熊洗碗)生成視頻片段。雖然目前生成的短視頻清晰度不夠,但Google聲稱ImagenVideo是朝著具有“高度可控性”和世界知識的系

2023-11-17

合生成視頻。這些結果似乎遠非現實,但與去年 Meta 的 Make-A-Video 系統制作的粗糙動畫相比,它們也顯得更上一層樓。目前還不知道用戶何時能在 Facebook 或 Instagram 上看到這些新的編輯功能,也不知道這一消息是否與 Meta 去年預

2023-04-02

Opus.ai目前正在開發一個人工智能驅動的視頻內容開發工具,該工具將使用戶能夠僅使用純文本構建虛擬世界。根據該公司的網站,該工具將以比傳統開發更快、更少的成本制作原創內容。雖然還沒有上市,但該公司目前正在接

2024-03-28

線的同時,OpenAI 曾在博客中表示:今年第一季度我們將推出 GPT 創建者收入計劃。作為第一步,美國的創建者將根據用戶對其 GPT 的參與度獲得報酬。我們會提供有關支付標準的詳細信息。現在,真的來……OpenAI,要讓 GPT 貨幣

2024-05-31

站長之傢(ChinaZ.com) 5月31日 消息:Perplexity AI近日推出其最新功能——Perplexity Pages,這一創新的AI工具旨在幫助用戶以極快的速度生成專業級別的文檔,如報告、文章和指南。這一功能的推出不僅有望提升內容創作者的生產力,還

2024-05-30

式上線AI助手App騰訊元寶”。據官方介紹,騰訊今日正式推出全新的AI助手App騰訊元寶”,這款應用基於騰訊的混元大模型,集成AI搜索、AI總結、AI寫作等強大功能,為用戶帶來前所未有的智能體驗。騰訊元寶的亮點在於其出色

2024-02-18

理知識訓練給Sora。周鴻禕表示,Sora是記錄文生視頻AIGC的工具,它反映AI對世界的理解,是從文字進入圖像,再從圖像展示對這個世界3D模型的理解。

2023-12-07

在Google推出雙子座(Gemini)之後,Meta公司也在網絡上推出一種全新的、獨立的人工智能生成體驗-"與Meta一起想象"(ImaginewithMeta),允許用戶通過自然語言描述來創建圖像。與 OpenAI 的 DALL-E、Midjourney 和 Stable D

2024-03-09

微軟已刪除DesignerAI圖像創建器中使用的更多文字提示,這些文字提示曾創建過暴力或性相關作品。幾天前,微軟的一名現任員工向公司和美國政府正式提出警告,稱使用Designer(前必應圖像創建器)存在危險。CNBC的最新報道稱

2022-09-13

9月13日向iPhone用戶提供,但iPadOS 16將於今年秋天晚些時候推出。iOS 16兼容多種設備,但今年蘋果已經放棄對一些iPhone的支持,包括iPhone 6s和iPhone 7。在您打開iOS設備的設置頁面繼續下載之前,請確保你的設備在以下列表中:完整

2023-11-07

告客戶提供。該公司當時表示,明年將向全球所有廣告商推出這些工具。去年,OpenAI 的 ChatGPT 聊天機器人首次亮相,引起人們的狂熱追捧。迄今為止,這些公司幾乎沒有發佈任何有關它們計劃對這些系統施加安全防護欄的信息