人類幼兒正在啟發機器人學習的新方法

2023-08-10 發表於業界精選

數十年來，各組織一直在構建復雜的數據集，並不斷探索不同的方法來教授系統執行新任務。在部署能夠快速適應和學習的技術方面，我們似乎正處於實現真正突破的邊緣。去年，我們看到大量引人入勝的研究。就拿卡內基梅隆大學在今年6月展示的VRB（視覺機器人橋）來說，該系統能夠將從YouTube視頻中學到的知識應用到不同的環境中，因此程序員不必考慮每一種可能的變化。

上個月，Google的 DeepMind 機器人團隊展示 RT-2（機器人變形金剛 2），令人印象深刻。該系統能夠抽象出執行任務時的細枝末節。在所舉的例子中，讓機器人扔掉一個垃圾，並不需要程序員教機器人識別特定的垃圾、撿起來並扔掉，就能完成一項看似簡單（至少對人類而言）的任務。

CMU 本周重點介紹的其他研究將其工作與人類的早期學習進行比較。具體來說，機器人人工智能代理被比作三歲的幼兒。從上下文來看，學習水平分為兩類--主動學習和被動學習。

在這種情況下，被動學習是指通過向系統播放視頻或在上述數據集上進行訓練，教它執行任務。主動學習則如其所言--去執行一項任務並不斷調整，直到正確為止。

RoboAgent 由 CMU 和 Meta AI（沒錯，就是那個 Meta）聯合開發，它將這兩種學習方式結合在一起，就像人類一樣。在這裡，這意味著通過互聯網觀察正在執行的任務，並通過遠程遙控機器人的方式進行主動學習。據該團隊介紹，該系統能夠從一個環境中吸取經驗，並將其應用到另一個環境中，這與上文提到的 VRB 系統類似。

CMU機器人研究所的Shubham Tulsiani說："具有這種學習能力的代理讓我們更接近於一種通用機器人，它可以在不同的未知環境中完成各種任務，並隨著積累更多經驗而不斷發展。RoboAgent 可以使用有限的域內數據快速訓練機器人，同時主要依靠互聯網上大量可用的免費數據來學習各種任務。這可以讓機器人在傢庭、醫院和其他公共場所等非結構化環境中發揮更大的作用"。

所有這一切中最酷的一點是，該數據集是開源的，可以普遍訪問。它還可以與現成的機器人硬件一起使用，這意味著研究人員和公司都可以利用並建立一個不斷增長的機器人數據和技能庫。

機器人研究所的阿比納夫-古普塔（Abhinav Gupta）說："與其他公司相比，RoboAgents 的技能復雜性要豐富得多。我們已經展示比現實世界中任何單一機器人代理所能實現的更多樣化的技能，其效率和對未知場景的泛化規模都是獨一無二的。"

在構建和部署多用途機器人系統方面，這一切都大有可為，有望最終成為通用機器人。我們的目標是創造出一種技術，能夠超越我們在提到工業機器人時往往會想到的高度結構化環境中的重復性機器。當然，實際應用和擴展說起來容易做起來難。

說到這些機器人學習方法，我們更接近於起步階段，但對於新興的多用途系統來說，我們正在經歷一個令人興奮的時期。

人類幼兒正在啟發機器人學習的新方法

相關推薦

用世界模型訓練機器狗：1小時學會走路、翻身和通過障礙物

他們給機器人造大腦 OpenAI紅杉搶著投5億

哥大團隊開發“人臉機器人” 照鏡子自主模仿人類表情超逼真

新出生的機器狗，打滾1小時後自己掌握走路，吳恩達開山大弟子最新成果

李飛飛，最火AI女王

Google工程師硬核長篇預測證實黃仁勛觀點：AGI或在2029年出現

MIT博士讓機器人自學“常識”：大模型加持可自主完成復雜傢務勞動

機器狗一小時就能學會走路？模仿動物本能，研究已登Nature子刊

MIT研究人員利用人工智能將倉庫改造成高效樞紐

Google希望機器人可以產生自己的代碼

隻用13天 OpenAI做出能聽、能說、能自主決策的機器人大模型

2024蘋果學者名單公佈人占一半

李飛飛團隊祭出“靈巧手”：泡茶剪紙炫技開源版OpenAI機器人2.5萬打造

疊衣服、擦案板、沖果汁……能做傢務的國產機器人終於要來