當伊隆·馬斯克將一份可能是世界上最具誘惑力的工作機會擺在你面前的時候,你會做出什麼選擇?是毫不猶疑地啟程登艦,加入加速世界向可持續能源的轉變進程。還是先緩緩,看看其它公司給出的年終獎是不是比特斯拉更豐厚。
如果很難一下子做決定,不妨先來看看這場於北美時間 2022 年 9 月 30 日晚間,北京時間 10 月 1 日早上舉辦的特斯拉 2022 AI Day,深刻認知特斯拉公司業務和願景的同時,也好好對自己現有的工作能力進行一次全方位檢測。
畢竟這是一場連馬斯克都親口承認“內容相當硬核”的大型人工智能和機器人領域工程師全球互聯網招聘會。如果看不太懂,或許很難過五關斬六將,最終成為特斯拉正式員工。
FSD,沒有Beta
在出場順位上,特斯拉 FSD(完全自動駕駛能力)處於整場“招聘會”的腰部,這與該業務在整個特斯拉公司內的地位高度契合。
我們都知道,賽博朋克感極強的人型機器人是馬斯克為支撐公司市值特意建構的“虛擬現實”,但 FSD 是特斯拉兌現用戶想象,完成技術落地,實現商業化變現的核心手段。而且,是無可回避的那種。
在今年 8 月 4 日舉行的特斯拉股東大會上,馬斯克曾透露 FSD 10.13 版本的研究已進行一段時間,工程師做“一些非常重要的架構改進”,如改進左轉時的復雜問題等。當下,FSD beta 正在北美進行一定規模的測試,累計行駛裡程已突破 4000 萬英裡,有望在今年底開啟更大規模的測試。
在 2022 AI Day上,特斯拉公佈更加具體的數字的時間表:2021 年參與 FSD beta 測試的用戶數量為 2000 名,2022 年擴充 80 倍達到 16 萬名。這些用戶總共為特斯拉積累 480 萬段數據,完成對 7.5 萬個神經網絡的訓練,實現 35 個FSD 版本的更迭。在 AI Day 後,特斯拉將發佈 FSD 10.69.2.3 版,這會是一次“令所有人吃驚”的更新,馬斯克同時再次確認 FSD beta 版今年底將在全球范圍內進行部署的消息,但各個國傢的監管部門是否會批準,什麼時候批準,審批尺度會收緊到什麼地步,馬斯克沒有透露更多。
在自動駕駛技術路線選擇上,特斯拉依然在“純視覺感知”的道路上不回頭,這讓此前特斯拉有可能在近期重啟激光雷達方案的傳言不攻自破。不過需要指出的是,當前純視覺路線的硬件基礎是 HW 3.0,等 HW4.0 硬件到來時,馬斯克是否會主動上演“真香定律”,誰也說不準。
具體來看, FSD beta 的做法是:先利用迭代 4 次的自動數據標註系統對已收集的實際道路行駛數據進行特定標註,這套專供內部使用的標註語言特斯拉在使用中不停優化。再把標註後的數據“喂”給神經網絡,讓它們在豐富的數據海洋中一邊遨遊,一邊完成自我訓練。最後,將訓練後的神經網絡部署進 FSD ,提升車輛的駕駛輔助能力。
聽起來整個工作鏈路並不復雜,但實際工程師需要解決的問題,是一個接一個。
整個過程中,特斯拉車輛上的攝像頭對周圍環境進行感知後完成視頻片段捕捉所產生的數據量十分驚人,訓練一個神經網絡需要的數據量和時間也十分驚人—— 14.4 億幀圖像,超過 10 萬個 GPU 訓練小時,視頻緩存超過 30 PB。
所以,數據標註的效率就顯得尤為重要,高效的數據標註能有效提升神經網絡的訓練效率,更高的神經網絡的訓練效率可以產生許多魔法,比如讓 Occupancy Network 僅僅通過攝像頭就實現激光雷達的感知能力,不知著急忙慌讓激光雷達上車的中國造車新勢力們看到這裡,作何感想。
說那麼多專業名詞,這套 FSD beta 的到底進化到什麼程度呢?我們以自動駕駛的史詩級難題——無保護左轉為例,檢驗下系統能力。
無保護左轉是人類在駕駛中遇到最棘手的事情之一,車輛需要在復雜的車流、標線、交通標志、行人間找到一條安全程度最高的路線,並在極短的時間內做出決策,完成左轉動作。即便你駕駛經驗足夠豐富,也很難確認從要加入車道右側駛來的車輛也不會撞上來以及其它突發狀況。
人類老司機面對左轉都會發怵,更別提現階段還沒那麼聰明的自動駕駛。無保護左轉對自動駕駛車輛的環境感知和實時預測都提出極高挑戰, GPS 定位系統、攝像頭、激光雷達、毫米波雷達等硬件可以解決環境感知問題,但它們很難預測人類駕駛員的意圖,到底對面是一個禮讓型駕駛員,還是激進型駕駛員,機器無從得知。
所以,特斯拉的做法是學習人類的做法——實時感知,即時計算。在展示案例中, 特斯拉在左轉時遭遇橫道線上遛狗的行人、加入車道的右側來車和加入車道的後方來車, FSD beta 的在預測不同交通參與者的行動軌跡後,給出幾條不同的行駛策略,與底層大數據庫比對後,選擇一條最佳行車路線:即禮讓行人和狗,又避開右側和後方來車,順利且安全的完成一次無保護左轉,其果斷程度已經超過許多人類駕駛員。
如果隻靠行駛在路上的車隊進行數據收集, FSD beta 的進化不會如此迅速。特斯拉還有一個名為“仿真系統”的武器,利用這套道路場景生成器,就好像你在魔獸爭霸中自建地圖那樣,特斯拉可以在 5 分鐘裡部署一套道路場景,車流、行人、路口、樁桶、信號燈、標線、路旁停車位、樹木、建築等各種細節一應俱全,這大大提升數據采集的速度,拓寬數據來源的廣度,一些在真實世界無法復現的邊角案例,都可以在“仿真系統”內二次搭建,反復訓練,直至神經網絡牢牢記住並運用。
所以,我們總結下:FSD beta 的現有能力,是海量數據滋養出的。數據主要采集於真實世界行駛中的特斯拉車隊和虛擬世界中的仿真系統這兩個渠道。
等等,是不是缺點什麼?
超算道場 DOJO
想完成海量數據的實時運算和結果輸出,特斯拉需要一個足夠強力的底座,DOJO這臺性能強悍的訓練計算機應運而生。
去年 AI Day 上,特斯拉對外展示訓練芯片 DOJO D1 和基於此打造的集群 ExaPOD。 DOJO D1 芯片基於臺積電 7 納米工藝制造,可以在 400W 的散熱設計功耗下實現 22.6 TFLOPS的 FP32 算力。然後,特斯拉把 25 個 D1 芯片分裝到量身打造的基底模具——訓練 Tile 上,再利用臺積電的 InFO_SoW 晶圓上系統技術將它們封裝,每個 Tile 可提供 9 千萬億次浮點運算和 36 TB/s 的 Tile 外帶寬。
每個訓練 Tile 有七層結構,你可以把它想象成一個厚厚的三明治,第一層和第五層是水冷散熱夾層,第二層是 25 個D1 芯片,第三層是封裝基板,第四層和第七層是承重層,第六層是功率模塊和通信互聯模塊。
隨後,特斯拉將 120 個封裝後的訓練 Tile 組裝成 ExaPOD 超級計算機集群,總計 3000 個 D1 芯片,算力達到 1.1 EFLOP,是當之無愧的史上最快 AI 訓練計算機。更可怕的是,下一代 DOJO 芯片會提升 10 倍性能。當然,落地時間還是未知數。
絕大多數人,包括筆者在內都很難在短時間內對這些單位和數字產生認知,為便於理解,你可以把 DOJO 當成一臺算力沒有理論上限,可無窮無盡擴展的超級大殺器,前提是有足夠容納機櫃的空間和足夠雄厚的資金。
根據特斯拉的計劃,2023 年之前將在美國加州完成第一臺 DOJO ExaPod 超級計算機集群的建造落地。它會讓特斯拉整體工作效率大幅提高,將需要花費數月的工作縮減至一周。
比汽車更有價值的機器人
最後,我們再來看看三個大活中的最後一個,也是大眾感知度最強的一個——機器人。
2021 AI Day 上,馬斯克公佈人形機器人 Tesla Bot 原型機,身高 1.72 米,體重 56.6 千克。一年後, Tesla Bot 變成 Optimus 擎天柱原型機,一臺可自主完成獨立行走、揮手致意、舞蹈動作的機器人。
除前述這些炫技型動作, Optimus 原型機還可以在汽車工廠搬運貨物零件、給植物膠水、移動金屬棒。機器人主要依靠不同顏色來區分現實場景中的不同物體,從而實現精準對象的定點操作,具體的顏色劃分規則特斯拉沒有公佈,但可以確定的這是一套純視覺識別方案,和 FSD beta 如出一轍。
馬斯克認為人類更應該將精力放在腦力勞動而不是體力勞動上, Optimus 人形機器人的出現就是為將人類從簡單繁重的體力勞動中解脫出來。他預計一臺人形機器人規模量產後的成本不超過 2 萬美元,花這點錢來“釋放”一個人類,看起來是一門再劃算不過的買賣。
數據上看, Optimus 人形機器人的靜止功率為 100 W,快走功率為 500 W,關節自由度超過 200 個擋位,手部支持 27 擋調節。和人類靈活的雙手確實沒法比,但貴在進步。 Optimus 人形機器人內裝單顆 FSD 芯片,算力為 72 Tops,電池容量 2.3 度,充滿一次電,理論上可以運行一整天。
在人形機器人的關鍵能力——抓取和操縱實體物品上,特斯拉在 Optimus 上傾註大量心血,通過 6 個執行單元,實現手指關節的 11 擋自由移動,提取重量的上限做到 9 公斤。雖然這個重量在健身房裡隻能算再初級不過的菜鳥訓練選手,但至少比隻能四肢著地的“狗型運動物體”更符合人類對機器人的想象。
不過,馬斯克心中真正的人形機器人並不像 Optimus 這般威武雄壯,距離感十足,他更偏愛身姿妖嬈,風情萬種的貓女版人形機器人。
寫在最後
雖然馬斯克提前預告 2022 AI Day 的硬核程度,但實際公佈內容的硬核度,還是遠超絕大部分人的想象和認知邊界,不知這場大型網絡招聘會後,馬斯克的郵箱裡會收到多少封世界頂級人工智能和機器人領域工程師的簡歷。
我們或許還沒有勇氣給馬斯克的郵箱投送簡歷,但這並不妨礙我們聽聽 51 歲的馬斯克在現場給出的七條既不油膩,也不說教的人生與職場經驗,或多或少能對我們有所啟發:
1,盡早加入特斯拉;
2,與聰明人交朋友,接近聰明人;
3,盡可能的多讀書;
4,有好點子,一定要緊緊抓住;
5,做大事,比如造火箭時,別喝酒;
6,大事做成後,比如火箭造完,可以躺在沙灘上喝一杯;
7,偶爾,僅僅是偶爾,停下來聞聞路邊的花香。