昨天,GPT-4.5的消息在各大論壇傳得是沸沸揚揚,世超以為OpenAI要出來反擊Claude。沒想到第二天凌晨,OpenAI借著另一傢機器人公司,祭出另外一個殺手鐧——把ChatGPT裝到機器人的腦子裡。
看他們放出來的視頻 demo ,這個大概一米七的機器人,不僅能聽懂人話,做起事兒來也相當麻溜。
問站它在那裡都能看到啥,還沒反應幾秒,就能說出答案:蘋果、水杯等等,連工作人員站在一旁,手搭在桌子上的細節都能準確講出來。
隨後,問它能不能遞些吃的東西過來,這次都沒怎麼反應,就把蘋果拿給工作人員。
這還不算最厲害的,這個機器人的手指也是相當靈活,讓它撿桌子上的紙團時,它絲毫沒把紙團搞變形,力度起到好處,感覺下一步就能揉面包餃子……
整理起桌面來,也是有條不紊的,不過有時候反應的時間確實有點久。
而且視頻裡的這些操作,全都是機器人的 “ 自主意識 ” ,沒加速,遠程操作也是不存在的。
照工程師的說法,它現在就跟剛會說話的幼兒差不多,能講出看到什麼,也能做些簡單的行動計劃,短期內發生啥也能記起來……
不知道大夥看到這個視頻反應是啥樣,至少差評君工作群裡都是直呼 “ 牛 X ” 的程度,甚至有同事已經開始擔心起智械危機。
要知道,這距離 OpenAI 宣佈和 Figure 合作,才過去兩個星期。
而除 OpenAI 之外,微軟、英偉達和亞馬遜創始人傑夫 · 貝佐斯也都入 Figure 的夥。
另外,世超發現 Figure 也算是一個非典型機器人公司,包括波士頓動力在內,一般機器人公司的創始人都是學術圈大佬。
而 Figure 創始人的 Adcock ,卻是個馳騁商海的富哥們兒,在辦 Figure 之前,手裡有個招聘公司 Vettery ,還是一傢起降飛機企業 Archer Aviation 的大股東。
就在前年,他說為造福全人類,準備一門心思搞人形機器人,就把招聘公司賣,又退出 Archer Aviation ,拿到的錢準備全砸在 Figure 上。
人才的話,也基本靠挖,波士頓動力、特斯拉、Google這些大廠都被他挖個遍。
有人才好辦事,到第二年年初, Figure 就做出五個機器人原型,簡單走走、搬重物都不在話下。
直到今天,和 OpenAI 合作搞出 Figure 01 一鳴驚人。
網上全都是一水兒的好評,有人說 “ AGI 即將到來 ” ,也有人拉踩一波隔壁的波士頓動力,說他傢的機器人隻會跳舞。
世超看到這個視頻,也很興奮,麻溜找找搞人形機器人的朋友聊聊,他們的評價也出奇的一致,覺得 Figure 01 牛 x ,但大傢,似乎沒誇對地方。
首先, Figure 01 的出現,並沒有讓波士頓動力機器人跌落神壇。
因為衡量人形機器人厲不厲害有兩個標準,一個是 “ 腦子 ” ,另外一個是 “ 身體 ” 。波士頓動力在 “ 身體 ” 上依舊是業內公認最強。
Figure 01 則沒展示很多大幅度、高強度的動作,身體協不協調根本看不出來。
而 Figure 01 的牛當然不在於身體,而是在於它告訴大傢借助大模型的魔力,人形機器人是可以自主做計劃、執行任務、有記憶、聽懂人話的。
要知道在此之前,人形機器人一直都是偏科的體育生,身體不錯但是文化課掛科。
如果,咱是說如果腦子 + 身體都一級棒。那這段時間爆火的 “ 具身智能 ” 概念成真。
具身智能,說白就是讓人形機器人像人類一樣,能夠與真實的世界進行交互。學界還給它劃分五個階段,像是計算功能智能、計算感知智能、認知智能、內生智能和自主智能。
去年的 ITF World 2023 半導體大會上,那個愛穿皮衣的男人就公開給具身智能站臺,說它就是 AI 的下一個浪潮。
而現在的 Figure 01 ,則在第二階段和第三階段中間。
但即便如此,世超覺得距離人形機器人飛入尋常百姓傢,估計也還有不少距離。
一方面無論是 “ 腦子 ” 還是 “ 身體 ” ,都還有難點沒突破。
比如這 “ 腦子 ” 的訓練數據,是咱們和現實世界物理交互的數據,目前已經稀缺,和 ChatGPT 的文本數據相比,真就九牛一毛。
在身體這塊兒,連完全模仿人類的五隻手指都還做不到。
另一方面,人形機器人的商業化路徑還沒有共識。
通用機器人不是在一個成熟的技術裡找產品,而是邊突破技術邊界邊找到產品化的機會,要知道,即便火如大模型,目前最成功的產品也隻是聊天機器人而已。
不過,技術不是線性發展的,如果突破點出現,後面人形機器人的發展肯定也是井噴式的。
這條路,也永遠都不缺探路者,這兩年,做人形機器人的企業是越來越多,大廠裡像是特斯拉的擎天柱,國內也有小米 CyberOne 、智元機器人,逐際動力等等。
所以世超的預測,也很可能被打臉。
當然世超也很希望被打臉,對,如讓人形機器人寫稿的話,它應該不會拖搞吧。