特斯拉的人形機器人來,成本不到2萬美元(約合人民幣14萬元),最快3年內或許就能買到。就在今天,特斯拉又一次舉辦AIDAY活動,仍然發揮延遲開始的傳統藝能。
與往常馬斯克主講的模式不同,在本次AI DAY上,馬斯克穿著“撞衫”老黃的皮夾克簡短介紹此次重點展示的機器人Optimus(與變形金剛裡的擎天柱重名),之後都是各個業務負責人進行的講解。
特斯拉機器人團隊在過去一年內幾乎每周都工作7天,並且每天工作十幾個小時,終於在今年展示出原型機。
在活動一開始,一個周身沒有任何偽裝的機器人緩緩走上舞臺,完成行走、轉向、揮手等動作,從特斯拉展示的視頻來看,特斯拉Optimus還可以完成運輸物品,澆花等行為。
去年AI Day上,擎天柱還隻是一個概念圖。現在僅僅過一年,特斯拉就拿出來一個能夠行走和進行多種行為的原型產品,不得不說特斯拉的技術團隊是真的很強。
▲特斯拉Optimus出場
對於這一產品,馬斯克非常看重,認為其價值將會比汽車、自動駕駛更加重要。他認為特斯拉將會在未來生產數百萬臺機器人,成本低於2萬美元(約合人民幣14萬元),未來3~5年就能購買到。
而在自動駕駛方面,特斯拉一直在完善自己的技術和產品,目前FSD Beta版本已經有16萬名用戶在使用,而今年底就將會具備全球推廣的能力。
此外,特斯拉自研Dojo超算平臺,目前這一產品也正在幫助特斯拉在自動駕駛、機器人等方面取得更多成績。
整場發佈會下來,特斯拉的多位工程師對特斯拉在Optimus、FSD、Dojo等方面進行詳細的軟硬件介紹,但幾乎在每個產品介紹的時候,特斯拉都聊到希望更多的AI、硬件等人才可以加入特斯拉來做出更多有意義的產品。
也就是說,為招聘合適的人才,特斯拉特意舉辦一場發佈會。
不過從這場發佈來看,特斯拉已經不僅僅是一傢電動汽車公司,在人形機器人、自動駕駛和超算等方面已經進行很深的佈局,正在成為全傢非常硬核的科技公司。
01.
Optimus原型機亮相 成本不超2萬美元
在發佈會開始,馬斯克就展示特斯拉制作的機器人Optimus原型,從直播上來看,率先亮相機器人造型確實很原型,周身直接裸露著電線,沒有做任何裝飾。
機器人可以獨立完成行走,向用戶揮手致意,甚至跳舞等內容。
▲特斯拉Optimus可以跳舞
馬斯克表示,Optimus其實可以做更多事情,受限於舞臺隻能展示這些。從現場展示的視頻來看,Optimus除可以四處走動之外,還能完成運輸物品,澆花等行為。
▲特斯拉Optimus可以運輸東西
在工廠裡,機器人能將一個長條狀的物體從工作臺拿下來,再整齊排放至裝有相同物體的盒子中。在機器人視角的渲染圖中,它能夠用顏色區分開現實世界中的不同物體。如它手持的長條形物體是紫色、工作臺是黃色等。
▲特斯拉Optimus搬運工廠貨物
隨後,特斯拉推一個更接近真人的版本的Optimus,看上去和去年AI DAY上展示的模型有點類似,具備類似人類的外觀,自由度也更高一點。
在使用過程中也可以提供更多服務,如手指可以自由移動,可以操作很多工具,右手可以拿一些工具,甚至在工廠做一些重復的工作等。
▲特斯拉Optimus
不過,馬斯克表示,在過去的一年中,機器人團隊一周工作7天,每天工作十幾小時,雖然特斯拉已經做很多工作,但這個機器人目前還處在早期階段未來還可以將其做的更好。
按照介紹,完全體的特斯拉人形機器人“擎天柱”體重73kg,用電功率在靜坐時為100W,快走時500W,全身有200多個自由度,手部27個自由度。
馬斯克對這一產品的成本等信息進行劇透,他認為目前可以在市面上看到一些其他的機器人,但成本非常高,特斯拉的Optimus可以低成本生產,預計未來產量可以達到數百萬臺,而成本或許會低於2萬美元(約合人民幣14萬元)。
對於這一產品,馬斯克顯然非常看好,他表示,機器人可以降低勞動成本,更好的發展經濟,未來將沒有貧窮,人類可以自由選擇工作類型,體力活將不再是人類必須選擇的,人類可以更多的參與腦力工作。
雖然自動駕駛汽車非常重要,可以將運輸能力可以提升一個數量級,帶來革命性的變化。但機器人可以降低經濟成本,讓社會發展更有動力。馬斯克希望機器人可以更加安全的為人類帶來更多幫助。
▲特斯拉Optimus
而在現場,馬斯克也不忘給自己打廣告:“我們舉辦這個活動的目的就是為吸引更多的AI人才加入我們,做出更好的產品。”
在馬斯克做完簡單的介紹之後,特斯拉的設計團隊對Optimus的設計進行一些介紹。
特斯拉一位機器人負責人介紹一些機器人的具體進展,在去年的AI DAY上,特斯拉簡單介紹特斯拉的機器人,到目前已經進行三次演進,最終呈現出現在的結果。
Optimus采用的核心傳感器為攝像頭,和特斯拉FSD系統中采用的攝像機類似。目前特斯拉收集很多數據來訓練機器人。
特斯拉Optimus的電力系統集成到上半部分,之所以這麼設計則是考慮特斯拉汽車的設計方案,希望減少更多的線束,將配電和計算集中在軀幹中心。其中包含一塊電池組,容量為2.3kWh,充一次電後可以運行一整天。
▲特斯拉Optimus核心零部件展示
特斯拉機器人使用單顆特斯拉自研SoC芯片,支持LTE 4G連接,但和汽車所采用的不一樣,機器人需要處理視覺數據做出迅速反應、基於多種感官輸入和通訊,因此裝有無線電連接、音頻支持以及需要保護機器人本體和人類的安全特性。
在行動方面,特斯拉的擎天柱依然吸取特斯拉電動車的動力系統。設計的時候,特斯拉先分析機器人需要進行哪些行動,包括行走、上下樓等。首先通過對機器人行走的動態數據進行分析,然後就能夠分析出這些移動需要的時間、能耗和軌跡,根據這些數據就能設計出關節和執行器。
安全性方面,特斯拉也做一些設計。為保護機器人,研發人員對其結構基礎進行優化,在人形機器人摔倒時不會把變速器和胳膊弄壞,就可以將這一技術應用到機器人之上。畢竟一臺機器人的維修成本很高。
▲特斯拉Optimus可自我保護
研發人員采用與汽車相同的底層技術,讓機器人在所有組件中產生壓力,使得其行走控制變得更加容易,也不會那麼僵硬。
▲特斯拉Optimus行走姿態模擬
以膝蓋為例,人形機器人在設計時需要仿照人類真實的膝蓋結構。
▲特斯拉Optimus模擬人類骨骼結構
研發人員將人類的膝蓋和其運動過程中所受的力線性化,從而學習如何讓機器人膝蓋使用更少的力來構建,讓其能實現更好的力度控制,並讓相關結構緊密的包裹在膝蓋周圍。
執行器共有6種,包括電機、類似重量秤一樣的牽引執行器等。特斯拉在現場也展示一段視頻,可以通過牽引執行器吊起一臺鋼琴。
▲特斯拉Optimus牽引執行器可以吊起一臺鋼琴
人形機器人的另外一個重點就是手部。特斯拉希望擎天柱的手部也能跟人類一樣靈活,能夠抓住物體,進行操作,並且擁有傳感器進行感知。
設計擎天柱的手部時同樣從生物學生吸取靈感。通過6個執行器,讓擎天柱的手可以實現11個自由度的移動,並且可以拿動20磅的重量,並且可以操作一些器械,或者抓取小型物體。
特斯拉的技術專傢在現場講到,汽車就是輪式機器人,擎天柱某種程度上隻是把汽車立起來。
在機器人的行動方面,擎天柱使用特斯拉電動車同樣的神經網絡——“占用網絡”來識別可行駛區域。
▲特斯拉Optimus采用占用網絡識別
在行走方面,軟件在感知和分析外部環境後,會畫出行駛軌跡,然後根據軌跡規劃出每個腳的落腳點,然後再讓執行器執行。
人形機器人的一個重點就是保持直立狀態,不能輕易就倒地。如何做到?通過傳感器和對外界的情況進行感知,當受到外部影響的時候能夠自行調節控制器的扭矩並最終讓它保持平衡。
抓取方面,特斯拉先通過對人的抓取行為的動作進行軌跡數據采集,然後再映射到機器人身上,從而讓它能夠進行一些抓取動作。
▲特斯拉Optimus通過真人動作抓取來模擬動作
未來,特斯拉希望讓擎天柱變得更加靈活,希望從原型機能夠走的更遠,讓它在各方面都進行改善,擁有更好的導航、行動能力等。
02.
發力自動駕駛 年底具備全球推出FSD能力
自動駕駛方面,特斯拉首先介紹FSD的情況。2021年,FSD測試有2000客戶參加。2022年擴展到16萬客戶。特斯拉目前積累480萬段數據,訓練7.5萬個神經網絡,並在此基礎上推出35個FSD的版本更新。
自動駕駛技術架構方面,特斯拉的做法是先用自動化的數據標註系統對收集的數據進行自動標註,然後對數據進行處理後,來訓練神經網絡,然後將AI模型部署到FSD計算機中,通過計算來算出對外部環境的感知結果並算出本車的行駛規矩。
技術展示方面,特斯拉首先展示一下無保護左轉能力。比如在左轉的時候有行人和其他車輛,特斯拉在考慮到不同交通參與者的行駛軌跡後,算出最合適的行駛軌跡。
▲特斯拉FSD系統應對無保護左轉
具體呢,特斯拉使用一個名為交互搜索的技術。
首先從視覺感知開始,去感知交通參與者,然後去推測他們的行駛軌跡,然後生成幾種策略,最後再選擇出最佳的行駛軌跡。
▲特斯拉交互搜索技術架構
這裡需要註意,外部目標如果越來越多,需要的計算量也會越來越大。
特斯拉通過環視攝像頭來對外界進行感知,生成3D環境,並通過占用網絡來找到可行駛區域,並知道哪些是障礙物。
工作時候,第一步是先對攝像頭的圖像進行校準,把圖像整合在一起就形成3D空間,將數據進行提取,輸入到神經網絡裡,通過相應的算法就構建空間特征。
▲基於視覺數據構建3D空間
這裡有個問題,僅僅生成3D空間後,沒有各種物體的精確位置,依然無法進行路徑規劃。所以特斯拉的做法是通過對關鍵特征進行分析來算出位置數據。
特斯拉的車隊在日常行駛中積累很多視頻片段。每個視頻有何多幀圖像,需要14億幀才能訓練一個神經網絡,需要使用10萬個GPU工時(1個GPU工作1小時),訓練量很大。
這裡就需要使用超級計算機和AI加速器。這也是特斯拉為啥自己搞Dojo超算的原因,能夠提升30%的網絡訓練速度。
其他交通參與者的行為預測方面,特斯拉也介紹一下自己的做法。
攝像頭的畫面會先進入到RegNet網絡,處理之後的數據再進入Transformer模型之中。可能有10億個參數,對他們進行共同的優化。想要實現的是最大程度實現算力,盡量減少延遲。
汽車在運行過程中將會產生大量的數據,而這些數據也需要進行標註。
在進行標註的時候,特斯拉最先嘗試手工標註,但費時費力,之後有考慮過供應商合作的方式,但從最終的結果來看,無論是時效性還是質量都不是很好,而特斯拉需要非常高效且具備可擴展性的標註。
目前特斯拉采用的人機合作的標準方式,既有人類標註,也有機器標註,但整體而言,機器標註的效率更好,機器30分鐘的工作量,人類可能需要更長時間,因此特斯拉正在構建自動標註系統。
▲特斯拉基於自動標註的數據訓練模型
通過高效率的標註,讓現實世界中的時空片段轉化為可以使用的數據,從而讓FSD更加智能和高效。
及時自動標註也需要進行梳理,之前特斯拉方面並沒有投入太多精力在這方面,而現在已經有很多工程師在做這方面的工作。
此外,在自動駕駛中,非常重要的一部分就是仿真系統,這可以提升車輛對於長尾場景的應對能力。
特斯拉建立一個場景生成器,最快在五分鐘內就可以生成一個場景,速度提升1000倍,還可以掃描現實物體投射到屏幕上,可以模擬信號燈、停車標志等,盡可能接近真實世界。
▲特斯拉的場景生成器
這對於訓練來說,意義非常重大。
而通過數據引擎,可以讓神經網絡更加真實,能夠帶來更多的確定性,去解決現實世界的不確定性。如在路口轉彎時,要判斷橫停的車輛究竟是停車狀態還是緩慢行駛,隻用創建更多的網絡進行評估,就能解決這樣的場景。
目前特斯拉的數據集,一部分來自車隊傳回的信息,另一部分來自模擬數據,都可以更方便的對場景做出判斷。
而對於特斯拉FSD Beat的推廣情況,特斯拉今年年底將具備在全球推出FSD的能力。但北美之外,需要跟監管方進行溝通,而在有些國傢和地區,監管還很滯後。
03.
Dojo不斷迭代 正促進特斯拉發展
在之前關於機器人和自動駕駛的介紹中,特斯拉工程師已經多次提到Dojo超算平臺。
在去年的首屆特斯拉AI Day上,特斯拉展示其首款AI訓練芯片Dojo D1,以及基於該芯片構建的完整Dojo集群ExaPOD,用於執行AI訓練任務,為其上路車輛龐大的視頻處理需求提供支撐。
當前特斯拉已經擁有基於英偉達GPU的大型超算,以及一個存儲30PB視頻素材的數據中心。
特斯拉還展示一組過去兩年間從交付定制冷液分配單元(CDU)到安裝第一臺集成Dojo機櫃、再到2.2MW機組負載測試的照片。
▲特斯拉研發Dojo超算的關鍵節點
特斯拉一直試圖優化Dojo設計的可擴展性,並以“快速試錯”的心態來克服挑戰。Dojo加速器具有單個可擴展計算平面、全局尋址快速存儲器和統一的高帶寬+低延遲。
特斯拉技術工程師特別談到電壓調節模塊,它具有高性能、高密度(0.86A/mm²)、復雜集成性。
▲電壓調節模塊
其電壓調節模塊在24個月內更新14個版本。
熱膨脹系數(CTE)很重要,因此特斯拉與供應商合作提供電力解決方案。其CTE降低50%以上,Dojo的性能是初始擴展的3倍。
會上,Dojo團隊展示通過Dojo實現Stable Diffusion在火星上運行Cybertruck的圖像。
據介紹,隻用4個Dojo機櫃就能取代由4000個GPU組成的72個GPU機架。Dojo能將通常需要幾個月的工作減少到1周。
此外,特斯拉自研的D1芯片也發揮作用。D1采用臺積電7nm制程工藝,在645mm²的面積上塞500億顆晶體管,BF16、CFP8算力可達362TFLOPS,FP32算力可達22.6TFLOPS,TDP(熱設計功耗)為400W。
基於D1芯片,特斯拉推出晶圓上系統級方案,通過應用臺積電InFO_SoW封裝技術,將所有25顆D1裸片都集成到一個訓練Tile上,每個Dojo訓練Tile消耗15kW。特斯拉Dojo訓練Tile中有計算、I/O、功率和液冷模塊。
▲Dojo超算的Tarining Tile模塊
Dojo System Tray有高速連接、密集集成等特性,75mm高度能支持135kg。其BF16/CFP8峰值算力可達到54TFLOPS,功耗100+kW。
Dojo接口處理器是一個具有高帶寬內存的PCIe卡,利用特斯拉自傢TTP接口。
特斯拉傳輸協議TTP還可以橋接到標準以太網,TTPOE可將標準以太網轉換至Z平面拓撲,擁有高Z平面拓撲連接性。
自去年特斯拉AI Day至今,Dojo開發迎來一系列裡程碑,包括安裝第一個Dojo機櫃、進行2.2mW負載測試等,現在特斯拉正以每天打造一個Tile的速度推進工作。
▲Dojo超算機櫃
特斯拉還宣佈其第一個ExaPOD預計將在2023年第一季度完工,計劃在帕洛阿爾托總建造7臺ExaPOD。
據介紹,在10機櫃系統中,Dojo ExaPOD集群將突破E級算力。
其BF16/CFP8峰值算力達到1.1EFLOPS(百億億次浮點運算),並擁有1.3TB高速SRAM和13TB高帶寬DRAM。
04.
結語:特斯拉不僅是一傢汽車公司
在很多普通公眾印象中,特斯拉是全球電動汽車的領頭羊,是世界上首個將電動汽車大規模推廣起來的公司,也是一傢偉大的汽車公司。
但在特斯拉自己看來,汽車公司並不是其給自己的最終定位,特斯拉將自己能定位為一傢非常硬核的科技公司。所以特斯拉在自動駕駛、AI、機器人,甚至超算方面發力,並且還都做出一定的成果。
而為實現這些成績,特斯拉內部也進行非常多的努力,充分尊重有才華的員工,共同打造有價值的產品。