Google人工智能技術“Transframer”可根據一張圖片創建短視頻


隨著技術的發展,研究人員繼續尋找新的方法來利用人工智能和機器學習能力。本周早些時候,Google科學傢宣佈創建Transframer,這是一個新的框架,它能根據單一的圖像輸入來生成短視頻。這項新技術有朝一日可以增強傳統的渲染解決方案並使開發者能夠基於機器學習能力創建虛擬環境。

這個新框架的名稱(及在某些方面的概念)是對另一個基於人工智能的模型Transformer的點贊。Transformer最初於2017年推出,是一個新穎的神經網絡架構,它有能力通過建模和比較句子中的其他詞來生成文本。此後,該模型被納入標準的深度學習框架如TensorFlow和PyTorch。

據悉,Transframer使用具有類似屬性的背景圖像,結合查詢註釋來創建短視頻。盡管在原始圖像輸入中沒有提供任何幾何數據,但產生的視頻在目標圖像周圍移動並將準確的視角可視化。

這項新技術使用Google的DeepMind人工智能平臺進行演示,其功能是分析單一的照片背景圖像以此來獲得關鍵的圖像數據並生成額外的圖像。在這一分析過程中,系統確定圖片的框架,這反過來又幫助系統預測圖片的周圍環境。

然後,語境圖像被用來進一步預測圖片從不同角度會出現的情況。預測根據數據、註釋及語境框架中的任何其他信息對額外圖像框架的概率進行建模。

該框架通過提供基於非常有限的數據集生成合理準確的視頻的能力,這標志著視頻技術的巨大進步。Transframer任務在其他跟視頻有關的任務和基準上也顯示出極有前景的結果,如語義分割、圖像分類和光流預測。

對基於視頻的行業如遊戲開發可能具有潛在的巨大影響。目前的遊戲開發環境依賴於核心渲染技術,如著色、紋理映射、景深和光線追蹤。像Transframer這樣的技術有可能通過使用人工智能和機器學習來構建他們的環境並與此同時來減少創建環境所需的時間、資源和精力以為開發者提供一個全新的開發路徑。


相關推薦

2022-09-30

AI工具,普通用戶也可以輸入一些簡單的文本內容,經過人工智能加工之後生產媲美藝術傢的藝術插圖。而Meta最新推出的Make-A-Video工具則讓AI藝術生成工具更近一步,隻要一些簡單的文字就可以生成視頻。結果令人印象深刻且多

2024-04-09

傢的註意!先簡單介紹下階躍星辰,這是一傢專註於通用人工智能研究的公司,成立於2023年4月,致力於推動人工智能技術的發展,並已推出Step系列通用大模型,包括Step-1千億參數語言大模型、Step-1V千億參數多模態大模型,以

2024-08-28

%。2024年上半年,AI詐騙案超過1.85億。奇安信發佈的《2024人工智能安全報告》顯示,2023年基於AI的深度偽造欺詐暴增3000%。AI換聲、AI換臉、AI生成是AI詐騙常用的三種手段,其中AI生成內容,秒數有限,畫質和人物瑕疵明顯,因此

2023-02-06

的真人圖片,可能會危及相關聯人的隱私。一些提示導致人工智能復制一張圖片,而不是重繪完全不同的內容。這些重新制作的圖片還可能包含受版權保護的材料。但更糟糕的是,當代人工智能生成模型可以記憶和復制刮來的用

2023-03-16

型。”但OpenAI也表示,GPT-4並非完美,仍然不能完全摒除人工智能的“幻覺”,而且訓練數據的時間依舊停留在2021年9月,可能會出現推理錯誤:“有時會出現簡單的推理錯誤,會輕信用戶的虛假陳述,會像人類一樣解答不難題

2024-04-08

迎刃而解。——Sam Altman不過,這件事真的這麼容易嗎?人工智能研究者們已經研究合成數據多年,但要構建一個能自我訓練的人工智能系統並非易事。專傢發現,模型如果隻依賴於自我生成的數據,可能會不斷重復自己的錯誤

2023-04-25

。“我像一隻厚臉皮的猴子,去提交參賽的申請,想看看人工智能圖像是否會入選,結果出人意料,攝影界需要對這個事情公開討論。討論我們要考慮什麼是攝影,什麼不屬於它。攝影的保護傘是否足夠大,是否可以讓AI圖像進

2023-03-23

人工智能勢不可擋。本周,包括微軟、Google、英偉達、Adobe在內的全球多傢科技巨頭公司都不約而同地發佈或開放生成式AI新技術,其中微軟和Adobe發佈與圖像生成相關的新應用。然而,AI不僅可以幫助人類,也會被利用來戲弄人

2024-02-08

蘋果公司的研究人員發佈一個新的開源人工智能模型,它能夠根據用戶的自然語言指令編輯圖像。MGIE是MLLM-GuidedImageEditing的縮寫,它使用多模態大型語言模型(MLLM)來解釋用戶請求並執行像素級操作。該模型能夠編輯圖像的各個方

2023-09-13

活動周期內完成任務的商傢和內容創作者,返還圖文訂單技術服務費和圖文訂單傭金技術服務費,對圖文帶貨進行進一步激勵。幾乎是零門檻就可以入局的圖文帶貨,成為許多普通人的副業,甚至希望借此實現像頭部帶貨主播那

2022-12-21

直接勒令開除。但好在,這位John是一個由ArtsTechnica為做人工智能社交圖片實驗而虛構出來的人物。圖片來自Arts Technica網站,版權屬於原作者John的人物設定是一位普通的小學老師,和我們生活中的大部分的人一樣,在過去的 12

2023-10-31

OpenAI正在為ChatGPTPlus會員推出新的測試功能。根據一位訂閱者周日(10月29日)發佈在社交媒體Threads上的報告,這次功能更新包括上傳文件和處理文件的能力,以及多模式支持功能。上傳多種類型的文檔。GPT-4允許使用PDF、數據文

2023-12-06

一張圖片 + 一組動作 = 毫無違和感的視頻。然後啊,這項技術一經公佈,可謂是在科技圈裡掀起不小的波瀾,眾多科技大佬和極客們紛紛下場耍起來。就連HuggingFace CTO都拿自己的頭像體驗一把:順便還風趣地開句玩笑:這算是健

2022-08-16

。AI創作成潮流,矽谷大廠擠破頭早在2020年,全球知名的人工智能基礎科研機構OpenAI發佈一個名為GPT-3語言模型。當時OpenAI的論文題為“LanguageModelsareFew-ShotLearners”,直接點出超大規模語言模型在多種非訓練人物上具備強大、快