Google新型人工智能可將圖像轉化為可玩的小遊戲

2024-03-08 發表於業界精選

生成式人工智能主要以創建令人震驚的可信文本和靜態圖像而聞名，這種工具也已開始編輯相當逼真的視頻剪輯。包括遊戲在內的互動體驗可能是下一步的發展方向之一。Google的研究可以讓人工智能影響虛擬世界的構建，用人工智能來訓練人工智能。

Google DeepMind 最近發佈一款人工智能模型 Genie，它可以利用靜態圖像制作小型互動遊戲。Google表示，這項技術背後的基礎可以促進其他應用，比如訓練人工智能機器人。

Genie是在大約 20 萬小時的公開遊戲畫面（可能來自Google子公司 YouTube）基礎上訓練出來的。目前還不清楚使用它的人是否會與這些遊戲的創作者發生版權糾紛。

值得註意的是，人工智能不需要文本或動作標簽來解釋它所看到的內容，它隻需通過視頻幀來解讀哪些元素應作為地形，哪些元素應作為可控制的頭像。Genie還能解讀圖像中的三維深度，從而在遊戲中模擬視差滾動。

該工具可以根據繪畫、草圖、渲染圖、照片和其他類型的圖像構建小型視頻遊戲關卡。由於Genie可以處理它以前從未見過的圖片，因此它還可以根據人工智能生成的內容構建環境，從而為使用一個人工智能的內容在另一個人工智能中創造新事物開辟前景。

不過，還有改進的餘地。與其他人工智能模型一樣，Genie也會產生幻覺。此外，最初的迭代版本隻能記憶多達 16 個幀，這嚴重限制它在保持一致的情況下構建關卡的大小。該模型 1fps 的運行速度也有很大的改進空間。

為確保準確性，Genie 的初步演示側重於復制 2D 平臺遊戲。不過，Google表示，可以訓練它創建其他類型的遊戲和虛擬內容。

例如，Google表示，Genie 可以幫助更有效地訓練某些機器人。使用人工模擬進行的訓練隻能提供有限的場景，而 Genie 可以構建更廣泛的虛擬環境和對象，供機器人學習。

通過進一步開發，Genie 可以將交互式佈景變成生成式人工智能的下一個主要領域。目前，視頻正成為人們關註的焦點，尤其是 OpenAI 在上個月推出 Sora，它可以制作逼真的 60 秒 1080p 短片。不出所料，人工智能生成的視頻並不完美，但它代表該技術的重大飛躍。

相關推薦