Figure與OpenAI合作13天 AI機器人驚艷面世能對話、能思考、會學習

2024-03-14 來自財聯社發表於業界精選

美東時間周三，半個矽谷都在投資的“機器人界OpenAI”、明星初創公司Figure發佈自己第一個OpenAI大模型加持的機器人demo。僅僅是一個視頻，就驚艷全球科技界。而更讓人驚嘆的是，此時距離Figure宣佈和OpenAI在AI人形機器人領域合作才剛剛過去13天。

Figure3月初宣佈，其已從亞馬遜創始人貝索斯、英偉達、OpenAI和微軟等巨頭那裡籌集約6.75億美元的資金，使其公司估值達到26億美元。

首個OpenAI機器人來！

在Figure發佈的視頻裡顯示，機器人Figure 01可以聽懂人類的命令和提問，動作流暢且有邏輯地遞給人類蘋果、將垃圾收拾進框子裡、將杯子和盤子歸置放在瀝水架上。

而最重點的是，Figure 01的很多舉動和回答是根據提問者的一些開放性問題和要求，基於邏輯思考而得出的——這意味著它能對話、能思考、能學習，比一般的機器人更“像人”。

視頻開頭強調，這個機器人的行為都是基於語音的邏輯推理，使用端對端神經網絡，且視頻全程1倍速，沒有經過加速。

接下來，正片開始，提問者開始在視頻中給Figure 01提出多個問題和要求，且難度越來越高。

當一開始被問到“Figure 01，你現在能看到什麼？”時，Figure 01給出準確的回答：“我看到一個桌子中間有個紅蘋果，一個瀝水籃和一些杯子和盤子，還有你站在桌子旁，手放在桌子上。”

提問者接著問道：“我有什麼能吃的嗎？”Figure 01動作流暢地把紅蘋果遞給提問者。

接下來，提問者往桌上倒幾個黑色塑料袋團，並給出更高難度的要求：“你能一邊解釋你剛剛為什麼這麼做，一邊把垃圾收起來嗎？”

Figure 01繼續做出完美的反應：他一邊動作流暢地將塑料袋團收到籃子裡，一邊回答道：“我剛剛給你個蘋果，因為這是桌子上唯一能吃的東西。”

接著提問者給出更開放性的問題：“你看看你現在面前的場景，你覺得你面前的盤子該去哪？”

Figure 01基於人類常識作出回答：“盤子和杯子可能該放在瀝水籃裡。”然後在提問者的下一句要求“那你把它們能放到那邊去嗎？”後，準確的將杯子和盤子放進瀝水籃。

值得註意的是，提問者提出的“那你能把它們放到那邊去嗎（Can you put them there）？”並沒有準確的提出“杯子”“盤子”和“瀝水籃”等關鍵詞，而是隻用代稱，這表明Figure 01有聯系上下文思考和記憶的能力。

提問者最後讓Figure 01對自己的表現給出評價：“你覺得自己做得怎麼樣？”Figure 01回答：“我覺得我做得很好。蘋果找到新主人，垃圾都被扔掉，餐具也放到該放的地方。”

OpenAI所提供的超強大腦

盡管視頻隻有短短2分鐘，但其包含的信息量卻巨大：這個名為Figure 01的機器人已經可以完全與人類流暢對話，理解人類的自然語言指令和意圖並進行動作，同時解釋原因。它甚至可以對自身行為做出主觀的評價。

這在這背後提供支持的，就是OpenAI所提供的“大腦”。

就在3月1日，，Figure才剛剛宣佈將與OpenAI合作，開發下一代人形機器人的人工智能(AI)模型。Figure將基於OpenAI最新的GPT模型開發AI模型，並專門訓練Figure收集的機器人動作數據，以便其人形機器人可以與人交談，看到東西並執行復雜任務。

而才剛剛過去13天，這個具備人工智能的人形機器人便火速面世並驚艷科技圈——AI模型的成長速度真的令人震撼。

在視頻發佈後，創建Figure 01的高級AI工程師（也是視頻中出鏡的提問人）科裡·林奇（Corey Lynch）對Figure 01的表現作出更多的解釋。

“我們的機器人可以描述它的視覺體驗，計劃未來的行動，反思它的記憶，並口頭解釋它的推理，”他在X上寫道。

根據林奇的說法，他們從機器人的攝像頭中輸入圖像，並將車載麥克風捕獲的語音文本轉錄到OpenAI訓練的大型多模式模型中。

林奇強調，Figure 01的行為都是通過學習而習得的，絕不是遠程控制。

根據官網介紹，Figure 01機器人身高5英尺6英寸（約1.67米），體重60公斤，可載重20公斤，續航5小時，前進速度1.2米/秒。

在OpenAI的技術支持下，Figure 01僅用13天就能完成這樣令人驚艷的學習和思考能力。這不禁讓人期待，在未來，更加“聰明”的機器人恐怕會比我們想象的更早到來。

相關推薦