視頻對比AI技術結合前後1X夏娃機器人自主系統產生的變化


一個月前,我們還對這些機器人能夠拿起東西、放在正確的位置、打開門並自行充電印象深刻。但幾個小時前發佈的新視頻清楚地表明,自主仿人機器人的工作正開始瘋狂加速。挪威機器人公司1X是OpenAI在仿人機器人領域的另一個賭註--最近的頭條新聞是它對美國公司Figure的投資和合作。

(JPEG 圖像,2880x1798 像素) — 縮放 (49-.jpg

1X 的夏娃機器人沒有腿,它們在有輪子的平臺上滾來滾去。它們也沒有像 Sanctuary AI、Figure 和特斯拉等公司制造的那種超凡脫俗的手,而是用看起來笨拙的爪子抓人。而且它們的外觀也令人大跌眼鏡--老實說,它們的笑臉看起來很傻,而且正如我們之前指出的那樣,它們身上的小軌跡排列讓它們看起來像是在參加雪橇比賽時遲到。

不過,他們的學習速度確實令人眼花繚亂。首先,請快速瀏覽一下 2024 年 2 月 9 日發佈的這段視頻。

現在,請看 1X 在不到六周後發佈的三月更新視頻。

在短短的時間內,這些機器人所處理的任務的復雜程度有巨大的飛躍--它們完全自主,全部采用相同的行為人工智能模型工作。讓我們回顧一下這段視頻所展示的內容:

  • 多步驟任務處理,如從購物袋中挑選物品,決定放在哪裡,以及在放好物品後打開和關閉櫥櫃門

  • 使用柔軟的工具,這裡指的是用佈擦拭溢出物

  • 不用拇指就能靈巧地完成一項棘手的物理任務,因為它能將紙箱的四個標簽折疊在一起

  • 完全自主的襯衫折疊要求機器人巧妙地處理可變形的表面

這感覺就像人形機器人的 GPT-3 時刻--它們突然出現在每個人的視線中。亞馬遜公司的 Agility Digit、寶馬公司的 Figure's 01 和梅賽德斯-奔馳公司的 Apptronik'sApollo 都是如此。

這些視頻,以及上面的視頻,Figure 的"01"在工作時開始說話和推理,還有下面的視頻,顯示Sanctuary 的"Phoenix"開始展現驚人的速度和流暢的動作--這些都讓我感受到那種令人胃痛的加速感,在過去一兩年裡,任何試圖跟上人工智能和機器人技術發展的人都會有這種感覺。

有很多反對者認為,仿人機器人技術的發展意義不大,但整個行業正在邁出第一步。這些人工智能模型剛剛開始學習如何利用實體與世界互動,它們正在拼湊有用工作的基礎構件。

它們沒有被編程,而是在人類助手的指導和幫助下,或多或少地自己解決這些問題。而且,所有這些下一代人形機器人都非常年輕,大多數隻運行一兩年。再看看這些視頻,問問自己,人類嬰兒能多快學會它們。

圖片.png

請記住,這些都是舊機型,所使用的芯片和硬件很可能在過去 36 小時內就已被取代,這一領域的加速度已經令人咋舌。

圖片.png


相關推薦

2023-04-12

些內部調研,以下是七項GPT-5最具變革性的能力。1音頻和視頻處理——更強大的多模態處理能力GPT-5比GPT-4更加強大的數據理解能力,可以在多模態理解方面表現更出色。它將延續GPT-4的文本和圖像處理功能,同時加入音頻和視頻

2023-03-28

一輪融資,因為我們的使命是一致的:深思熟慮地將新興技術融入人們的日常生活。在投資者的支持下,我們將繼續在機器人領域取得重大進展,並擴大全球勞動力市場。”OpenAI首席運營官兼OpenAI創業基金經理Brad Lightcap表示:

2022-08-08

仰、側身與轉向,從而適應高低起伏的地形。官方發佈的視頻中,Max在極端地形中展現出極好的動作控制能力,能夠精準感知到自身和梅花樁的位置,找準樁面中心,動作連貫,落點準確,在窄小的樁面完成快速行走、踏步旋轉

2024-04-01

定表情的樣子。然後,研究小組為Emo播放人類面部表情的視頻,通過逐幀觀察並學習。經過幾個小時的訓練後,Emo可以通過觀察人們面部的微小變化,來預測他們的面部表情。這項研究主要作者Yuhang Hu表示,“我認為,準確預測

2024-03-14

”他或許說對。北京時間3月13日深夜,一段人形機器人的視頻開始在X上熱傳。之前從未展示過機器人方向能力的OpenAI,在與投資公司的人形機器人的合作中,第一次展示自己的機器人智能能力。Figure,OpenAI 投資的機器人公司,

2022-08-30

機器人大賽不同,盡管 XPRIZE 也通過面向全球的比賽推動技術發展,但其展開的比賽卻圍繞氣候環境變化、糧食危機、熱帶雨林保護等領域。本次面向機器人領域的 Avatar XPIZE 也和 DARPA 的機器人比賽有所不同,目的是尋找能夠將

2022-10-01

柱”,全身裸露天線的“擎天柱”初始版走下臺後,一段視頻中展示人形機器人的才藝。在特斯拉工廠內,“擎天柱”可以搬起印有特斯拉標志的箱子,並將其運送到其他地方。“擎天柱”能夠拿起放在桌子上的水壺,然後行走

2023-02-09

窺微軟通過 ChatGPT 改造搜索引擎服務的新想法。必應截圖對比新舊兩版必應,在搜索頁面,最顯眼的區別就是搜索框變成提問框,還限制 1000 以內字數。盡管都是文字框,但在樣式和文字提示下,新必應無疑在鼓勵你寫一個問題

2024-03-19

世界上第一場一切都是自制的音樂會。你將要看一些傢庭視頻。所以請坐下來,好好享受吧。好吧,天啊,我愛NVIDIA。加速計算已達到轉折點。通用計算已經走到盡頭。我們需要另一種計算方式,以便我們可以繼續擴展,以便我

2024-03-21

型。GPT-4V和Sora代表生成式AI的未來,即多模態模型和包括視頻在內的視覺大模型,英偉達的進步讓規模更大、更多模態和更先進的模型成為可能。在AI推理方面,目前越來越大的模型規模和越來越高的實時性要求,對於推理算力

2024-03-19

數據進行訓練,能夠用於各種各樣的任務,從生成句子到視頻、圖像等等。據Nvidia,Project GR00T將幫助人形機器人“理解自然語言並通過觀察人類行為來模仿動作 - 快速學習協調性、靈活性和其他技能,以便導航、適應並與現實

2024-05-08

業研報指出,當前AI工具正不斷被應用至美術資產生成、視頻生成、音頻生成、代碼生成、文本翻譯、智能NPC交互等各領域,研運AI滲透率不斷提升,看好AI將不斷提升遊戲研運效率。遊戲作為AI主要應用領域之一,將受益於AI產

2023-02-18

器人依然存在很多缺陷。谷歌母公司Alphabet發佈的Bard宣傳視頻顯示,這個聊天機器人分享不準確的信息,導致該公司市值當天損失超過1000億美元。不過,微軟預計,必應AI聊天機器人更人性化的回應將為其搜索功能帶來更多用戶

2024-01-31

月。據介紹,它的厲害之處在於能夠通過觀看人類的示范視頻,僅需10小時端到端訓練,就能學會並完全自主搞定煮咖啡這樣的任務。至於具體實現細節,官方沒有透露。OpenAI還支持另一傢公司除此之外,OpenAI在人形機器人方面