[視頻]樂高不會拼?這款AI能幫你根據手冊拼搭出成品


被樂高套裝難住?最新開發的機器學習框架能夠引導你拼接完成。來自斯坦福大學、麻省理工大學加速季科學和人工智能實驗室、AutodeckAI實驗室的科研團隊聯合開發一種基於機器學習的框架,能夠根據2D拼搭指導手冊來展示3D效果。

該框架叫做 Manual-to-Executable-Plan Network(簡稱 MEPNet),目前已經在多款計算機生成的樂高套裝、真實的樂高套裝指南和 Minecraft 風格的立體建築上成功測試,科研人員表示其性能已經超過現有其他版本。

對於人工智能來說,理解 2D 指導手冊並不容易。研究人員表示,視覺指令有幾個關鍵問題,就像樂高套裝一樣,完全由圖像組成:識別 2D 和 3D 對象之間的對應關系,以及處理許多基本部件都非常困難。

研究人員表示在,任何復雜的樂高套裝都是建立在基礎的樂高磚塊上。研究人員表示這增加機器對樂高手冊的理解難度,它需要推斷由可見圖元組成的不可見物體的 3D 姿勢。

研究人員表示,現有的將手動步驟解析為機器可執行計劃的方法主要包括兩種形式:基於搜索的方法,簡單準確但計算成本高;以及基於學習的模型,這些模型速度很快,但不太擅長處理看不見的 3D 形狀。

研究人員說,MEPNet 結合兩者。研究人員寫道,從組件的 3D 模型、樂高集的當前狀態和 2D 手動圖像開始,MEPNet “預測每個組件的一組 2D 關鍵點和掩碼”。

完成後,2D 關鍵點“通過找到基本形狀和新組件之間的可能連接,反向投影到 3D”。該團隊寫道,這種組合“保持基於學習的模型的效率,並更好地推廣到看不見的 3D 組件”。在論文中,研究人員表示,他們的目標是創造幫助人們組裝復雜物體的機器,他們的應用列表中包括傢具、樂高積木和像素世界。


相關推薦

2024-05-01

們在使用真正的 Rabbit R1 硬件一樣,正如你在下面嵌入的視頻中看到的那樣。我們沒有對 Spotify 整合、Vision 等其他功能進行測試,但如果其中某些功能無法正常工作我們也不會感到驚訝,Rabbit R1 的啟動器應用程序是預裝在固件

2022-06-25

近日,微博話題#樂高將漲價#沖上熱搜,並很快引發網友的熱議。實際上,樂高集團(LEGO)官方6月初就在海外發佈聲明稱,由於過去兩年能源、物流和原材料價格持續攀升導致成本上升,將於8-9月間將部分熱門套組提價5-25%,而

2023-03-25

造如今市值萬億的蘋果公司。現在風頭正旺的 ChatGPT ,會不會也重演這個奇跡呢?

2024-05-27

漫剪,你可以快速、方便、簡潔、高效地制作小說推文的視頻、圖片等形式。🎬4. 愛推文 📚愛推文是一個利用AI繪畫幫助用戶將小說推文轉化成漫畫視頻解說的工具。所有畫面、字幕、配音均為原創,保證純原創視頻內容。📖

2023-03-27

為,文心一言有兩大優勢:一是,畫圖、寫長文、文字轉視頻等多模態生態能力是ChatGPT所不具備的;二是,文心一言具備中文理解能力優勢。但是,百度自詡的優勢也許會成為文心一言所面臨的大問題。近日,有網友在對百度

2022-09-07

鍵軸之外,這款由MelGeek推出的機械鍵盤Pixel能夠讓你體驗樂高的樂趣。如果您碰巧有一堆樂高積木,那麼通過鍵盤側面和底部的樂高凸起,那麼您可以按照自己的偏好重新設計整個外殼。這款機械鍵盤並未獲得樂高的官方授權,

2023-06-16

一、前言:面向用戶使用場景 打造高效的生產力工具6月9日,訊飛星火大模型V1.5正式亮相,時隔一個月後,星火大模型的各項能力獲得持續的提升,此次更新的重點正是突破開放式問答、多輪對話能力和數學能力。在開放式問

2022-08-02

形式是幾本手冊,無需企業授權,全世界誰都可以下載,根據手冊開發自己的RISC-V處理器。

2024-02-22

2024年春節假期,高樂高和同伴在東京秋葉原附近的一條小巷裡找到一傢湯咖喱店。他先在小紅書上看到推薦,又通過Google地圖檢查這傢店的評分,4.4分,一個還不錯的分數。味道很不錯,餐廳氛圍也很適合聊天。起初,他和朋

2024-02-23

主要因為該模型能夠根據文字提示迅速生成相對高質量的視頻。不過Sora和其他一些圍繞文字、圖像和音頻開發的人工智能模型在某些方面還存在缺陷,限制人工智能的工作范圍,娛樂行業的創意工作者似乎並不過分擔憂自己的

2023-03-23

鈕,直接就幫你替換好。程序員看是不是爆哭:以後再也不會為一個小符號搭上一天的時間?接下來,代碼完成後,檢驗一下質量吧?吶,Copilot可以迅速幫你搞定一段單元測試:這還沒完,既然Copilot可以聊天還無所不知,編程

2023-02-08

新的AI功能中Bing和Edge目前都沒有附加任何廣告,也暫時不會收取其他增值服務費用,看起來微軟可能寧願放棄部分收入也要從Google手中去爭奪市場份額。而微軟的AI征程可能僅僅隻是拉開序幕而已,目前跟OpenAI的合作還在加快拓

2022-06-28

以讓手機設備保持在最新的狀態。研究人員稱,這種類似樂高積木的芯片設計包含兩層,一層是交替式的傳感層。另一層是用於芯片進行光學通信的發光二極管層。在他們的新芯片設計中,研究人員將圖像傳感器與人工突觸陣列

2023-03-25

作系統,我們目前還不得而知。但可以肯定的是,它一定不會隻是一個陪你聊聊天的AI機器人。