北京時間9點19分,一個全身裸露電線的人形機器人緩緩走上特斯拉AIDay2022的舞臺,向現場觀眾揮手打招呼。去年8月,特斯拉CEO馬斯克在第一屆特斯拉AIDay上重磅公佈特斯拉首款人形機器人“擎天柱”(Optimus)的概念圖。今年,為讓人形機器人順利發佈,馬斯克將“特斯拉AIDay”從原定的8月19日推遲40多天!
今天,“擎天柱”終於從一個身著白衣、頭戴黑面紗的真人扮演者變成真的機器人,馬斯克的“造人夢”照進現實。
“我們的目標是盡快制造出有用的仿人機器人。”馬斯克說,擎天柱將是一種“能力極強的機器人”,產量非常高,最終將生產數百萬臺,並且預計成本將遠低於汽車——不到2萬美元。
按其說法,擎天柱最初會從事一些枯燥或危險的工作,比如在特斯拉工廠周圍移動部件,或用扳手給汽車安裝螺栓。按照馬斯克的設想,未來機器人還可以用於傢庭、做飯、修剪草坪和照顧老人,乃至成為人類的“夥伴”或伴侶。
同時馬斯克談道,要完善並證明擎天柱,還有很多工作要做。
他還在活動期間發推文,透露擎天柱機器人將會有“貓女版”。
01.
能澆水、送物、流水線工作
6個月推出原型機
完全體的特斯拉人形機器人“擎天柱”體重73kg,用電功率在靜坐時為100W,快走時500W,全身有200多個自由度,手部27個自由度。馬斯克稱,一個人形機器人的成本大概在2萬美元之內,遠低於一輛汽車。
在現場,馬斯克展示工程版“擎天柱”,全身裸露天線的“擎天柱”初始版走下臺後,一段視頻中展示人形機器人的才藝。
在特斯拉工廠內,“擎天柱”可以搬起印有特斯拉標志的箱子,並將其運送到其他地方。
“擎天柱”能夠拿起放在桌子上的水壺,然後行走至辦公室內的花草種植區,為花草澆水。其中,渲染的圖片就是機器人的“視角”,看起來除色彩差異與人類正常看到的圖像內容沒有特別大的區別。
在工廠裡,機器人能將一個長條狀的物體從工作臺拿下來,再整齊排放至裝有相同物體的盒子中。在機器人視角的渲染圖中,它能夠用顏色區分開現實世界中的不同物體。如它手持的長條形物體是紫色、工作臺是黃色等。
隨後,一臺更像人的“擎天柱”被推上現場,它同樣可以張開雙手或抬起右手,向臺下緩慢打招呼。
真機版本的“擎天柱”因為腳下有支撐裝置,還可以同時抬起雙手雙腳。
不過,與初始版本不同的是,優化版“擎天柱”並沒有在現場走動,而是全程由工作人員搬運。
在過去的四個月裡,特斯拉的人形機器人就一直在辦公室內四處走動。
現階段,特斯拉人形機器人項目從去年2021年AI Day上的概念圖,到今年2月,短短六個月就推出原型機,現在已經有近似完全體的新一代“擎天柱”亮相。
特斯拉第一代機器人從概念、設計、分析、建立、優化、驗證經過反復驗證,對於這一新物種來說,擁有較低的成本和較高的工作效率也正是驗證這一產品是否能真正推向市場的關鍵。
02.
以汽車設計過程為基礎
優化調參至機器人平臺
擎天柱的設計是以特斯拉此前積累的車輛設計過程為基礎。
人類可以吃少量的食物來維持能量,因此為減少機器人上消耗的能力,特斯拉將人形機器人在空閑時消耗的能量降到最低,隻需要按下開關就可以調節其處於低電量或者正常工作的狀態。
1、電動和控制系統:28個驅動器+2.3kWh的電池組,可工作一整天
從其概念圖中可以看到,整個機器人包含28個電動驅動器(橙色)和電池及控制模塊(藍色)。
“擎天柱”身體中間有2.3kWh的電池組,工作電壓為52V,能支持人形機器人工作一整天。這個電池組的獨特之處在於,它把所有的電池電子都集成到一起,傳感器融合電荷管理等,利用汽車和機能源產品將其融合到一起。這也是特斯拉流線型制造的高效之處。
除技術外,當然也離不開特斯拉強大的基礎設施和供應鏈。
特斯拉機器人使用單顆特斯拉自研SoC芯片,不同於特斯拉在汽車上使用的雙芯片自動駕駛方案。
與汽車不同,機器人需要處理視覺數據做出迅速反應、基於多種感官輸入和通訊,因此裝有無線電連接、音頻支持以及需要保護機器人本體和人類的安全特性。
2、基礎結構設計:量化人體運動軌跡、力度,機器人行動更靈活
特斯拉有能力完成高度復雜的系統。如人們在駕駛時遇到的突然撞擊,汽車做出相應反應的過程。因此,為保護機器人,研發人員對其結構基礎進行優化,在人形機器人摔倒時不會把變速器和胳膊弄壞,就可以將這一技術應用到機器人之上。畢竟一臺機器人的維修成本很高。
研發人員采用與汽車相同的底層技術,讓機器人在所有組件中產生壓力,使得其行走控制變得更加容易,也不會那麼僵硬。
以膝蓋為例,人形機器人在設計時需要仿照人類真實的膝蓋結構。
研發人員將人類的膝蓋和其運動過程中所受的力線性化,從而學習如何讓機器人膝蓋使用更少的力來構建,讓其能實現更好的力度控制,並讓相關結構緊密的包裹在膝蓋周圍。
3、機械驅動系統:解析雲端數據,輕松定制28個驅動器
汽車和機器人在動力設計上有很多相似之處,因此,特斯拉在動力設計上的經驗可以應用到機器人上。
汽車的驅動單元是為讓汽車加速,機器人有28個關節驅動器,和汽車的驅動器在數量上相比差異並不明顯,但人形機器人要做的任務則更為復雜,它們需要走路或者攀巖,因此研發人員用模型生成機器人的連接轉矩速度軌跡,隨後輸入其優化模型來運行。
機器人需要轉動,研發人員根據扭矩速度軌跡和關節驅動器的效率圖,沿著軌道產生的能源消耗、任務與時間的累計能量,就可以定義特定執行機構的樣本,並發送到雲端。這樣一來,就可以縮短其生產成百上千萬關節驅動器的時間。
不過,機器人的每個關節都是特定的,28個關節都需要定制規格。因此,研發人員需要減少定制的執行器設計,解析它們上傳的雲並采取共性研究。
“擎天柱”的關節驅動器共有6種,包括三種不同規格的舵機、三種不同規格類似重量秤一樣的牽引執行器等。
在極限范圍內進行測試,其關節驅動器抬起一架半噸重的鋼琴,這也是人形機器人必須具備的功能。
4、手部感知系統:大、小形態均能抓握,手部也能感知物體
人手能以每秒300度的速度移動,擁有成千上萬的觸覺傳感器。特斯拉機械手的設計靈感就來自於生物學,和人手一樣同樣使用五個手指來驅動,既可以完成大口徑物體抓取,同時也能滿足抓取精巧物體的需求。
我們周圍世界的工廠被設計為適於人手抓握的,但也會出現很多我們沒見過的物體。因此,特斯拉的人形機器人手指有6個執行器和11個自由度,搭載能夠驅動手指並進行感知的傳感器。
手的適應機制是非常復雜的,人類可以認識到手在空間中的位置,而這也是其能抓取物體的關鍵。因此,特斯拉目前也在進行相應測試。
5、視覺導航系統:采用汽車同款神經網絡,自主識別行駛區域
在機器人的行動方面,“擎天柱”使用特斯拉電動車同樣的神經網絡——“占用網絡”來識別可行駛區域,研究人員稱,他們正在研發如何改善“占用網絡”,來使得機器人更快、更精準到達目的地。他們最近在訓練人形機器人的計算機視覺識別高頻特征,讓人形機器人能夠快速找到最近的充電站。
研發人員在模擬測試中,使用自動駕駛模擬器並集成機器人的運動代碼,在今年四月份,“擎天柱”的移動速度很慢。
研發人員演示擎天柱機器人的行動成長軌跡。從2022年4月份邁出第一步,到2022年7月,讓人形機器人解鎖骨盆的應用來保持平衡,2022年8月,讓手臂開始發揮作用,直到2022年9月,擎天柱的腳趾也派上用場,可以看出,隨著人形機器人慢慢將更多的關節等利用起來並加以訓練,它的移動速度有明顯提升。
6、行動控制系統:優化調參從測試映射至現實,解決機器人平衡難題
從人體步行的過程來看,機器人有身體上的自我意識很重要,如能意識到自己四肢的長度是多少、腳有多大,並且如何保持平衡,如何協調四肢運動。人類很容易就能做到這些,但對於機器人來說很難。
研發人員通過運動計劃和控制堆棧,生成機器人運動學模型,然後將所需路徑生成底層平臺,讓整個系統參考其軌跡進行訓練。
機器人模擬系統中按照其期望的路徑規劃一條線路,不斷添加相互連接的軌跡,然後根據軌跡規劃出每個腳的落腳點,然後再讓執行器執行,以此保證機器人行走過程中的平衡性。
在運動訓練中,運動規劃式是一個理想情形,但實際上將其放到現實世界上是不現實的。在這個過程中缺少幾個關鍵動作,將其放置到現實世界中,會對模型動力學造成影響,特別是像兩足動力學這樣穩定的系統。
研發人員利用相應的傳感器以及他們在現實世界中的觀察來解決機器人的控制難題,機器人的骨盆位置、重心位置,使用更好的機器人模型來進行訓練。
通過跟蹤機器人在工作室中的路徑來構建更好的機器人模型,並依據實際情況修正機器人的行為。
7、手部控制系統:人類模擬視頻映射運動參考,掌握抓握物體位置
為解決人形機器人在觀察的同時操縱真實的物體世界的難題,研發人員將這一步驟分成兩個,首先生成一個自然運動參考系統,然後再將其進行優化推廣。
假設有一個人類對某一動作進行演示,然後研發人員通過視頻對其動作設置關鍵幀,並將其映射到機器人上。這樣隻需要一個演示視頻,研發人員就可以將其推廣到機器人的現實操縱應用上。
這就可以解決機器人在抓取物體時手應該放在哪裡,如何進行搬運放置等難題。
03.
人形機器人進階路仍有無限可能
人形機器人這一新物種自誕生起就引發熱烈討論,今年已經有多傢知名科技公司發佈人形機器人,前有小米“鐵大”,現在特斯拉“擎天柱”在概念版亮相一年後,終於公佈可以走起來的工程版,同時在這次AI Day上,公佈十分完整的技術路線。
人形機器人因其技術集成度及難度都很高,被視作AI領域的終極形態,也將成為未來智能機器人的重點發展方向之一。
現如今,服務、工業、特種機器人已經深入到社會生活的方方面面,小至傢庭中的掃地機器人,大到工廠配送、機械臂等。而人形機器人仍然是一個新鮮事物。
從其技術難度而言,人形機器人不同於其他機器人形態,代表人們腦海中機器人的理想形態,其研發難度也可想而知。
特斯拉作為第一傢將其擺上臺面並在控制、步行方面都較為穩定的企業,離不開這傢公司在自動駕駛領域的多年技術積累。事實上,自動駕駛技術中的神經網絡架構、AI算法、激光雷達等都可以遷移至人形機器人研究中。
馬斯克在第一屆“AI Day”上曾說過:“我們的汽車是帶輪子的半感知機器人——用神經網絡識別世界,解如何在世界中導航。”
再加上隨著AI技術不斷進步,伴隨著人機交互能力加強,其具備的人形相比於其他機器人形態來說,能夠更好的滿足情感和陪伴需求,這也為人形機器人的發展帶來更多可能性。
談及馬斯克研發人形機器人的初衷,要追溯到四年前。馬斯克認為特斯拉的工廠“過度依賴機器人”,並且在很多任務上,機器人的表現並不如人類。因此,“擎天柱”的初始應用場景也被他放到代替人們從事枯燥、危險性的工作上。
04.
結語:馬斯克讓人形機器人
商業化之路可期
等一年之久的“擎天柱”,終於出現在大眾視野中,這也成為特斯拉“AI Day”最受矚目的環境。不過,其新奇的外觀與性能並不是關鍵,對於人形機器人而言,其真正量產落地才是衡量這一新物種是否真正有價值的關鍵。
但從其能澆花、搬東西這些更為細致的功能來看,馬斯克仍一直堅持著向擬人形態機器人不斷進階,從手部動作、步態調整、控制系統等,依托於特斯拉在汽車領域的強大技術積累,和基礎設施及供應鏈。再加上馬斯克在人形機器人領域的野心和他強大的行動力,為這一產業帶來無限憧憬。
馬斯克在人形機器人亮相後說:“自動駕駛汽車對世界產生的巨大影響,使得運輸生產力提升上至少提高半個數量級,未來,擎天柱或許會帶數個數量級的提升。”
此前曾有爆料稱特斯拉“擎天柱”預計2023年實現量產,計劃在德州工廠部署數千臺人形機器人,最終可能會擴展到全球數百萬臺。如果特斯拉的人形機器人能最終量產,並真正解決其落地難題,有望促進人形機器人的產業發展向前邁進一大步。