人類幼兒正在啟發機器人學習的新方法


數十年來,各組織一直在構建復雜的數據集,並不斷探索不同的方法來教授系統執行新任務。在部署能夠快速適應和學習的技術方面,我們似乎正處於實現真正突破的邊緣。去年,我們看到大量引人入勝的研究。就拿卡內基梅隆大學在今年6月展示的VRB(視覺機器人橋)來說,該系統能夠將從YouTube視頻中學到的知識應用到不同的環境中,因此程序員不必考慮每一種可能的變化。

roboAgent-02.webp

上個月,Google的 DeepMind 機器人團隊展示 RT-2(機器人變形金剛 2),令人印象深刻。該系統能夠抽象出執行任務時的細枝末節。在所舉的例子中,讓機器人扔掉一個垃圾,並不需要程序員教機器人識別特定的垃圾、撿起來並扔掉,就能完成一項看似簡單(至少對人類而言)的任務。

CMU 本周重點介紹的其他研究將其工作與人類的早期學習進行比較。具體來說,機器人人工智能代理被比作三歲的幼兒。從上下文來看,學習水平分為兩類--主動學習和被動學習。

在這種情況下,被動學習是指通過向系統播放視頻或在上述數據集上進行訓練,教它執行任務。主動學習則如其所言--去執行一項任務並不斷調整,直到正確為止。

RoboAgent 由 CMU 和 Meta AI(沒錯,就是那個 Meta)聯合開發,它將這兩種學習方式結合在一起,就像人類一樣。在這裡,這意味著通過互聯網觀察正在執行的任務,並通過遠程遙控機器人的方式進行主動學習。據該團隊介紹,該系統能夠從一個環境中吸取經驗,並將其應用到另一個環境中,這與上文提到的 VRB 系統類似。

CMU機器人研究所的Shubham Tulsiani說:"具有這種學習能力的代理讓我們更接近於一種通用機器人,它可以在不同的未知環境中完成各種任務,並隨著積累更多經驗而不斷發展。RoboAgent 可以使用有限的域內數據快速訓練機器人,同時主要依靠互聯網上大量可用的免費數據來學習各種任務。這可以讓機器人在傢庭、醫院和其他公共場所等非結構化環境中發揮更大的作用"。

所有這一切中最酷的一點是,該數據集是開源的,可以普遍訪問。它還可以與現成的機器人硬件一起使用,這意味著研究人員和公司都可以利用並建立一個不斷增長的機器人數據和技能庫。

roboAgent-03.webp

機器人研究所的阿比納夫-古普塔(Abhinav Gupta)說:"與其他公司相比,RoboAgents 的技能復雜性要豐富得多。我們已經展示比現實世界中任何單一機器人代理所能實現的更多樣化的技能,其效率和對未知場景的泛化規模都是獨一無二的。"

在構建和部署多用途機器人系統方面,這一切都大有可為,有望最終成為通用機器人。我們的目標是創造出一種技術,能夠超越我們在提到工業機器人時往往會想到的高度結構化環境中的重復性機器。當然,實際應用和擴展說起來容易做起來難。

說到這些機器人學習方法,我們更接近於起步階段,但對於新興的多用途系統來說,我們正在經歷一個令人興奮的時期。


相關推薦

2022-07-21

強化學習已經使機器人在棋類和電子遊戲等方面大大超過人類,但教會機器人在現實世界中做出正確的行動依然極具挑戰性。歸根結底,這是因為工程師們必須根據科學傢是否希望這種行為得到獎勵來進行編程。“將強化學習應

2024-04-12

YAY Robot)項目,展示機器人從語音糾正中實時改進,根據人類口語反饋來學習和不斷提升,執行靈巧操作任務的研究成果。Lucy Shi在個人頁面開心地分享自己以“第一位實習生”身份加入Physical Intelligence 的消息。自我介紹中她寫

2024-04-01

華人團隊打造全新的機器人Emo,不僅可以提前預測和模擬人類表情,還可以進行眼神交流。此前,人形機器人Ameca“大夢初醒”的神情,已讓許多人感受到真正的“恐懼”。隨著ChatGPT橫空出世,得到加持的人形機器人雖擅長語言

2022-06-30

狗;還有2個機械臂,在8-10小時實戰抓取後,表現接近於人類水平;以及一個擁有計算機視覺的小機器人,在自己摸索2小時後,能絲滑地滾動到指定位置。該研究由Pieter Abbeel等人提出,Pieter Abbeel是吳恩達的第一位博士生,前不

2024-03-04

發評估具身智能表現的模擬數據集——BEHAVIOR,擁有來自人類的1000種活動、5000多種物體模型。這些數據可以供智能體在任何虛擬環境中完成測試。2023年,李飛飛團隊接連公佈具身智能的多個成果。其中,NOIR 系統是將人類的腦

2024-03-09

最近,英偉達CEO黃仁勛表示,AI會在五年內通過人類測試,AGI將很快到來!英偉達CEO黃仁勛在最近的斯坦福活動上預測說,AI會在五年內通過人類測試,AGI將很快到來。而Google一位工程師前不久恰巧發出一篇長文硬核分析,認為20

2024-03-27

機器人是出色的人類模仿者,但大多離不開人類的幫助,比如一些預設的編程。尤其是傢用機器人,在面對復雜的傢務勞動時,如果“大腦”中沒有足夠多的常識,就很難滿足人類傢庭的日常需求。如今,在大型語言模型(LLMs

2022-07-20

”▲機器狗Morti一、摔倒後再爬起,Morti可模仿動物學習人類和動物的脊髓中都有一個叫做CPG(中樞模式發生器)的神經元網絡。CPG可以幫助生物完成節律性的任務,如走路、眨眼或消化等。這種神經元網絡不需要大腦輸入信號

2024-03-04

裡,數百個機器人在地面上來回穿梭,抓取物品並交付給人類工人進行包裝和運輸。這種倉庫正日益成為從電子商務到汽車生產等許多行業供應鏈的一部分。然而,要讓 800 個機器人高效地往返於目的地,同時又要防止它們相互

2022-11-02

問題有待解決,而機器人學習就在接近塔頂的地方。雖然人類確實在為特定任務的系統編程方面已經相當出色,但還有一個巨大的、開放的問題:然後呢?今天上午在紐約市舉行的Google人工智能活動上展示的新研究提出讓機器人

2024-03-14

這段視頻。在視頻中,Figure 的人形機器人,可以完全與人類流暢對話,理解人類的意圖,同時還能理解人的自然語言指令進行抓取和放置,並解釋自己為什麼這麼做。而其背後,就是 OpenAI 為其配置的智能大腦。在過去一年的具

2024-03-12

氣工程與統計學學士學位,導師是Yong Li。目前,Bowen Jin正在維護一個很棒的GitHub庫,關於圖上的大模型,並總結一篇綜述論文。Daogao Liu華盛頓大學,隱私保護機器學習Daogao Liu是華盛頓大學西雅圖分校的博士生,導師是Yin Tat Lee

2024-03-15

位。快看,它能一手拿著剪刀,一手拿著便利簽紙,執行人類剪紙這一動作。(不過剪斷的這個過程好難)它還可以將膠帶紙,放到收納的紙盒中,一手拿膠帶擺放,一手將盒子推近。而且不管這個物體是什麼,它都能照樣完成

2024-04-03

校的優秀人才,擁有雄厚的科研背景。公司的目標是“將人類從無意義的體力勞動中解放出來”,專註於機器人領域的基礎模型(foundation model)研發。目前,團隊正在構建一個具備從感知到行動的端到端能力的通用機器人大模