谷歌DeepMind推出Genie模型：110億參數、可基於圖片生成2D遊戲

2024-02-27 來自快科技發表於業界精選

谷歌發佈新交互模型——Genie，該技術將為AI領域帶來革命性的突破。據解，Genie共有110億個參數，能夠基於用戶輸入的一張圖片和提示詞，生成一款較為完整的2D平臺遊戲。Genie三由個部分組成：一個潛在動作模型，用於推斷每對幀之間的潛在動作；一個視頻tokenizer，用於將原始視頻幀轉換為離散token。

另有一個動態模型，用於在給定潛在動作和過去幀token的情況下，預測視頻的下一幀。這三個組件共同協作，使得Genie能夠生成具有高度交互性和可控性的虛擬世界。

Genie通過網絡上超過20萬小時的2D遊戲視頻訓練，目前隻是一個研究預覽版，這些遊戲更像是2D平臺遊戲，而不是完全的VR遊戲。

此外，它能生成圖像和其他資產，將你的草圖變成一個完全實現的開放世界，然後根據玩傢提供的操作預測下一個像素幀，Genie還可以應用於設計相關的創作領域，進一步拓寬創作者的想象空間。

相關推薦

Google新型人工智能可將圖像轉化為可玩的小遊戲

2024-03-08

響虛擬世界的構建，用人工智能來訓練人工智能。Google DeepMind 最近發佈一款人工智能模型 Genie，它可以利用靜態圖像制作小型互動遊戲。Google表示，這項技術背後的基礎可以促進其他應用，比如訓練人工智能機器人。Genie是在大

谷歌砸出5620億參數大模型機器人都能用學術圈已刷屏

2023-03-10

最大的視覺語言模型，PaLM-E的表現已經足夠驚艷。去年，DeepMind也發佈過一個通才大模型Gota，在604個不同的任務上接受訓練。但當時有很多人認為它並不算真正意義上的通用，因為研究無法證明模型在不同任務之間發生正向遷移

商湯自研大模型生成圖片涉嫌抄襲？公司回應稱也提供第三方社區開源模型

2023-04-13

12日消息，在近日商湯技術交流日上，商湯所演示的精選模型中出現AI模型站civitai的圖片，引發網絡質疑。據科創板日報援引商湯方面回應表示:“秒畫SenseMirage包含商湯自研AIGC大模型，也提供第三方社區開源模型支持導入多個平

5000億參數傳微軟準備推出自研大模型MAI-1

2024-05-07

據兩名微軟員工的說法，MAI-1模型由最近微軟挖來的谷歌DeepMind聯合創始人、人工智能初創公司Inflection前首席執行官穆斯塔法·蘇萊曼(MustafaSuleyman)負責。據悉，微軟還未明確MAI-1模型的確切用途，具體取決於模型效果如何。報道

DeepMind聯合創始人：GPT-5正在訓練中比當前模型大100倍

2023-09-03

快科技9月3日消息，DeepMind聯合創始人Suleyman近日在采訪中表示，GPT-5仍在秘密訓練中，未來將會比現在的GPT-4大100倍。其實，Open AI CEO Sam Altman此前曾否認訓練GPT-5的這一說法。有消息人士表示，OpenAI可能給它起一個新名字，所以

Google一月三大招硬剛OpenAI：開源最強大模型Gemini技術碾壓Llama 2

2024-02-22

ini的啟發，它的名字來源於意大利語“寶石”，是由GoogleDeepMind和其他團隊共同合作開發。Gemma采用與Gemini相同的技術和基礎架構，基於英偉達GPU和Google雲TPU等硬件平臺進行優化，有20億、70億兩種參數規模，每個規模又分預訓練

谷歌Parti生成器依靠200億參數將文本轉成栩栩如生的圖像

2022-06-24

谷歌周四介紹瞭Parti文本轉圖像生成器項目的最新進展，可知通過200億輸入的訓練，其已能夠創建出栩栩如生的圖像。不過為瞭避免AI數據集中存在的偏見風險，該公司並未通過公眾發佈的文本來展開訓練。（來自：Google Parti）

迄今最大！馬斯克AI大模型Grok開源：參數量達3140億

2024-03-18

軟等對手在大模型領域進行競爭，其團隊來自OpenAI、谷歌DeepMind、谷歌研究院、微軟研究院等諸多知名企業和研究機構。目前，xAI並沒有放出Grok-1的具體測試成績，它與其他公司的大模型之戰將成為業內關註的焦點。

OpenAI Sora核心技術被曝縫合自DeepMind和謝賽寧論文？

2024-02-18

有人扒出，Sora創新的核心秘密時空Patches，竟是來自GoogleDeepMind和謝賽寧的論文成果。OpenAI，永遠快別人一步！像ChatGPT成功搶Claude的頭條一樣，這一次，Google核彈級大殺器Gemini1.5才推出沒幾個小時，全世界的目光就被OpenAI的Sora搶

谷歌新AI火瞭：世界最長單詞都能畫：Pneumonoultramicroscopicsilicovolcanoconiosis

2022-06-30

……把它給畫出來呢？（讀都讀不出來，還畫畫？？？）谷歌最新提出來的一個 AI——Parti，它就能輕松 hold 住這事。在把這個單詞“投喂”給 Parti 後，它就能有模有樣地生成多張合情合理的肺部疾病圖片：但這隻是 Parti 小試

狂飆的ChatGPT，為什麼是OpenAI最先做出來？

2023-02-11

強公司。2016年打敗人類圍棋冠軍的阿爾法狗背後的AI創企DeepMind，就是被Google收購。這一年5月，GoogleCEO桑德·皮查伊（Sundar Pichai）宣佈將公司策略從“移動為先”轉變成“人工智能為先”（AI First），並計劃在公司的每一個產品

蘋果推出300億參數多模態大模型全面轉向生成式AI

2024-03-18

提示成為可能。然而，目前MM1的整體性能還沒有完全超過谷歌的Gemini和OpenAI的GPT-4，雖然MM1可能還不是絕對的領導者，但它仍然是蘋果在AI方面的一次重大飛躍。與此同時，蘋果公司還出手收購AI初創公司DarwinAI。DarwinAI以創建更

谷歌Gemini剛發就惹質疑：測試標準有失偏頗、效果視頻疑剪輯

2023-12-07

如RLHF之外更多的強化學習、搜索算法等。關於這一點，DeepMind創始人哈薩比斯在最新接受連線雜志采訪時作出回應：我們有世界上最好的強化學習專傢……AlphaGo中的成果有望在未來改善模型的推理和規劃能力……明年大傢會看

天工大模型3.0即將發佈：同步開源4000億參數MoE超級模型

2024-04-01

快科技4月1日消息，據昆侖萬維官微發文，天工大模型3.0將於4月17日正式發佈，並同步開源4000億參數MoE超級模型。這一模型采用4千億級參數MoE混合專傢模型，是全球模型參數最大、性能最強的MoE模型之一。相較於上一代天工2.0

熱門推薦