解讀特斯拉HW4.0:二代FSD與英偉達Orin比 誰更優秀?


在Twitter號稱“綠神”的@greentheonly最近公開特斯拉最新HW4.0的硬件實物圖片。這些信息非常有價值,我們可以一窺HW4.0中二代FSD芯片的最新進展和相關技術水平。


HW4.0 的硬件是“綠神”拆解自最新款的 Model X 車型。

據悉,特斯拉 HW 4.0 或將在特斯拉舉辦的投資者日上正式亮相,並開始全系量產上車。

從硬件實物來看,全新的 HW 4.0 不僅擁有性能更強的芯片,攝像頭分辨率、數量以及位置也發生相應變化,同時 HW 4.0 還將新增一個4D 毫米波雷達

01

特斯拉二代 FSD 由三星代工,采用 7 納米工藝

早在 2021 年,外界就有傳聞 FSD 二代將由三星代工,也有一種說法是特斯拉與三星聯合開發。

到 2022 年下半年,又有傳聞稱 FSD 二代由臺積電代工完成,且言之鑿鑿地說是 5 納米甚至 4 納米,還有消息稱這是第一顆車載 4 納米芯片


特斯拉二代 FSD 芯片真身,根據芯片表面絲印的數字,編號H2238,可以推斷出這是三星代工,並且極有可能隻是7 納米,不是 5 納米。


上圖為初代 FSD 芯片,編號 H1834

另外,Green 在Twitter上說“still samsung exynos IP”,這一點信息有誤。

眾所周知,三星自研 CPU 架構早在 2015 年就停止,現在三星都是采用 ARM 的公版架構,沒有自主 IP,並且初代 FSD 是三星代工的,所以用“still”,實際上是二代 FSD 仍然由三星代工。

芯片代工捆綁程度很高,如果一開始選定某傢晶圓廠代工,需要雙方合作建立該芯片制造工藝的 library,想要中途改換,需要重建 library,時間周期很長,最少需要 1 年時間,浪費大量研發成果。

特斯拉為什麼選擇三星?

主要原因恐怕還是成本——7 納米芯片,三星的代工價格不到臺積電的 1/3 甚至 1/4,三星低價搶單後果就是晶圓代工部門營業利潤很低,2021 年大約 6%,2022 年大約 10%,而臺積電是接近50%,是三星的5 倍

臺積電的產能一向不寬松,相對於蘋果、高通、英偉達和 AMD 動輒千萬上億的出貨量,特斯拉的訂單臺積電根本看不上。

5 納米,臺積電更是完勝三星,3 納米也是如此。

無論閘極還是內聯線寬,臺積電都完勝三星。這意味著在功耗方面,三星比臺積電遜色不少。

特斯拉選擇三星,就不大可能選擇還不太成熟的 5 納米工藝,因為三星的 5 納米比 7 納米提升不多,功耗也偏高。

特斯拉選擇三星隻能選 7 納米,因為工藝更成熟。

此外,還有地理優勢。

特斯拉總部目前在德克薩斯州奧斯汀哈羅德格林路,特斯拉最大工廠也在奧斯汀,特斯拉 Cybertruck 唯一工廠也在奧斯汀,而三星的晶圓代工廠跟特斯拉在同一個城市,也在德克薩斯州的奧斯汀。

準確地說是在奧斯汀略微偏北的 Taylor,離特斯拉並不遠,雙方可以互相高效溝通。

2021 年 11 月月,三星響應美國政府號召宣佈在美國德州投資170 億美元建立 S2-2 晶圓廠。

此前的 S2-1 工廠最高隻有11 納米,S2-2 廠可以到7 納米,預計 2023 年年初投產。

特斯拉的二代 FSD 芯片應該就在S2-2 廠代工

臺積電在美國也在建廠,不過地址在亞利桑那州的大鳳凰城,且在 2024 年底才能投產。

02

詳解 HW 4.0,特斯拉第二代 FSD 究竟實力幾何?


特斯拉 HW4.0 正面 PCB 如上圖,Green 在Twitter上說二代 FSD 的 CPU 內核由 12 個增加至20 個,運行頻率在1.37GHz-2.35GHz 之間。

初代 FSD 使用12 個 ARM Cortex-A72 CPU 內核。

A72 是 ARM 在 2015 年推出的架構,性能大約為6.1-6.5DMIPS/MHz,最高運行頻率差不多也是 2.4GHz,像後來推出的 A76、A77、A78 最高運行頻率可以達到3GHz 以上

從搭載 CPU 的性能來看,這也反證特斯拉 HW4.0 使用的還是 2015 年的 A72。

按初代頻率 2.2GHz 計算,20 內核 A72 的算力是20*2.2K*6.5=286K,與英偉達 Orin 的 12 核心 A78AE 比稍微低一點,Orin 是300K DMIPS


與 HW3.0 相比,HW4.0 一個明顯的區別是 HW4.0 元件更多。

HW4.0 上下還各多 24 路供電,尤其下面的 12 路供電,電感體積頗大,並聯的鉭電容陣列也頗為壯觀(大概率是松下的高精度鉭電容)。

HW3.0 的供電隻有 4 路,HW4.0 則多 20 路。我個人推測是因為二代 FSD 的功率大幅度增加,估計每片二代 FSD 的功率是 80-90 瓦,甚至有可能是 100-120 瓦,否則沒必要增加這麼多路供電。

這同樣也反證二代 FSD 采用的是 7 納米工藝。

為什麼這麼說?

這實際上與電腦主板供電類似。


上圖是典型的電腦主板,完整的 CPU 供電設計一般都需要包含上述部分。

PWM 芯片起到總控制作用,每一相完整的供電都是由:

1-2 個電感(一般是並聯或倍相的情形)

1-4 個 MOS(一般是高級的 Dr.MOS/2~4 個就是常規的上橋+下橋)

數個濾波電容(中低端主板固態電容,高端主板用鉭電容)等構成

電腦主板供電和車載運算系統供電是完全相同的:一般是開關電路。

開關電路是控制開關管開通和關斷的時間和比率,維持穩定輸出電壓的一種供電系統,主要由電容、電感線圈、MosFET 場效應管以及 PWM 脈沖寬度調制 IC 組成。

這一電路系統發熱量低,轉換效率高,而且穩壓范圍大、穩壓效果好。

一般來說,功率 65 瓦的電腦 CPU 一般是 4 相或者 6 相供電,250 瓦的顯卡一般需要 8 相供電,500 瓦的 RTX 4070 Ti 顯卡一般是 12+3(12 路 GPU,3 路顯存),更為高級的是16+4 路

多相供電的好處很多:

提供更大的電流;

降低供電電路的溫度,因為電流多一路分流,每個器件的發熱量自然減少。多相供電電路可以非常精確地平衡各相供電電路輸出的電流,以維持各功率組件的熱平衡;

利用多相供電獲得的核心電壓信號也比單相的來得穩定。

但多相供電的缺點是成本較高,而且對佈線設計、散熱的要求也更高,因此功率越大的產品所用的供電相數越多。

特斯拉使用 24 相供電(估計兩顆 FSD 是 18 路,6 路是顯存的),盡管采用水冷,推測兩顆 FSD 的功率仍然有大約150-200 瓦。

而 Orin 是多少呢?頂配 64GB 的 Orin AGX 最大功率為60 瓦


與 HW3.0 不同,HW4.0 的背板多8 顆內存,FPGA 代號為 D9ZPR,實際型號是 MT61M512M32KPA-14 AAT:C,特斯拉不惜血本,用上最頂級的 GDDR6。

GDDR 是 Graphics Double Data Rate 的縮寫,為顯存的一種。

GDDR 有專屬的工作頻率、時鐘頻率、電壓,因此與市面上標準的 DDR 存儲器有所差異,與普通 DDR 內存不同且不能共用。

一般來說,GDDR 比主內存中使用的普通 DDR 存儲器時鐘頻率更高,發熱量更小,更適合搭配高端顯示芯片。

GDDR 則是電腦愛好者熟悉的高級顯存,GDDR6 是英偉達 2018 年發佈 20 系列顯卡才開始出現的。

目前最強的消費級內存是 2020 年英偉達攜手美光推出的 GDDR6X。

不過和 AI 訓練用芯片普遍使用的 HBM2 內存還是差距明顯,當然,HBM2 價格遠高於 GDDR6X。

車載領域目前都是 LPDDR,特斯拉又開創先河:第一次在車載領域用GDRR

為什麼之前沒有車企使用?

一是算力需求不高;二是 GDDR 功耗高,用於車載領域並不適合。

不過特斯拉不在意,臺式機的 GPU 都敢放在車裡,更不用說功耗略高的 GDDR 。


LPDDR 參數


GDDR6 參數

GDDR6 最高運行頻率遠高於 LPDDR5,最高可達 1750MHz,傳輸速率大約是 12800MT/s,是 LPDDR5 的兩倍,代價是——功耗也差不多是 LPDDR5 的兩倍

特斯拉不惜血本,用 16 顆 GDDR6,總計 32GB,僅此一項成本就有大約 200-250 美元,HW3.0 則是 8 顆 LPDDR4,總容量 16GB,估計要 20 美元

Flash 存儲方面,HW3.0 是東芝的 THGAF8G8T23BAIL,這是 32GB 的 UFS,不過是較為陳舊的 UFS2.1 標準。HW4.0 改用三星的 KLUDG8J1ZD,容量提高到 128GB,但依舊是 UFS2.1 標準。

03

二代 FSD 的算力有多高?

對於特斯拉這種 One Shot 型的 NPU,增加算力就是增加晶體管數量,同樣的 Die 大小就要提高密度。

二代 FSD 的 Die 面積看起來差不多大小,考慮到 A72 的核心增加到20 個,也會占用部分 Die 面積,估計算力最多提高三倍,也就是216TOPS,仍然低於 Orin。

不過 FSD 的 SRAM 容量比較足,這是特斯拉一貫特色,二代 FSD 的實際算力和理想值會比較接近。


左邊是 HW4.0,右邊是 HW3.0 上面一層是座艙車機,下面一層是智能駕駛

單從接口看,HW4.0 至少有兩個以太網接口,從連接器判斷是標準的單對線車載以太網,不是早期的 EAVB 以太網。

在兩片 FSD 下面似乎有兩片車載以太網物理層芯片,應該是較新的 88Q2112。

新增以太網接口正是為對接特斯拉自己開發的 4D 毫米波雷達,傳統毫米波雷達用 CAN 或 CAN-FD 連接,4D 毫米波雷達信息量大,需要用百兆以太網。

板子中間最下方可能是以太網交換機,HW3.0 是 Marvell 的 88Q6321。

板子中間最下方可能是以太網交換機,HW3.0 是 Marvell 的 88Q6321。

HW4.0 顯然不會在使用這種相對落後、非嚴格車規以太網芯片。

據推測,HW4.0 應該換成性能較為先進的博通 BCM8956X 或 BCM8947X,也有可能是來自中國臺灣瑞昱,因為車機板上的以太網交換機正是瑞昱的產品。


左圖是 HW3.0 的智能駕駛接口。右圖是 HW4.0,上面一層是 HW4.0 的智能駕駛的接口,座艙有兩個顯示屏輸出接口。

智能駕駛方面:

紅色作為預留接口;

藍色代表駕駛員行為監測。

白色為連接兩個後向攝像頭;

黑色為前視攝像頭,可能兩個都是 500 萬像素。

我個人推測,特斯拉 HW4.0 減少一個前視攝像頭,增加一個後向攝像頭。

特斯拉用兩片 4 路解串行芯片,估計是美信的MAX96712,這個芯片在國內非常搶手。還有一片可能是 2 路解串行。

HW3.0 則是兩片德州儀器的 DS90UB960 和一片 DS90UB954,尺寸明顯比美信的要小。

其餘地方差別不大,仍然是 Spansion 的 64MB Nor Flash 做 Boot Loader。

電源管理似乎還是美信的 MAX20005。U-BLOX 的 GPS 被取消,換成更高級的三波段 GPS


這是 HW4.0 的車機部分,將 CPU 與 GPU 合二為一,放在一張 PCB 板上。


車機背板,無線通信模組還是 AG525R-GL,藍牙與 WiFi 還是 LG INNOTEK 的 ATC5CPC001。

總結一下,HW4.0 與 HW3.0 相比,進行如下的更新:

(1)HW4.0 比 HW3.0 的面積更大集成度更高。例如 HW4.0 的車機部分,將 CPU 與 GPU 合二為一,集成在一張 PCB 板上;

(2)內核部分升級不大,HW4.0 CPU 內核從 12 個增加到 20 個,最大頻率 2.35GHz,默認頻率 1.37Ghz,TRIP 內核數量從 2 個增加到 3 個,最大頻率 2.2GHz

(3)HW4.0 NPU 芯片封裝面積增大,供電部分加強,HW4.0 功耗大概是 HW 3.0 的 2 倍

(4)HW4.0 開創先河,在車載領域率先使用 GDDR,HW4.0 將顯存升級到 16G GDDR6 每核心,超過 HW3.0 每核心 8G LPDDR4,推測 FSD 整體算力得到3-5 倍提升

(5)在域控模塊的 PCB 板上,攝像頭接口增加:由 HW 3.0 的 9 個接口增至 12 個攝像頭接口。具體來說,由原來的前置三目攝像頭變為雙目,佈局為:2 個側視攝像頭,1 個前攝像頭、1 個倒車影像攝像頭、4 個側向 ADAS 攝像頭以及座艙內的 1 顆攝像頭,一共 11 顆,還有 1 顆備用攝像頭。前向感知攝像頭從 120 萬像素提升到 500 萬像素。

(6)GPS 模塊升級,使用三頻 GPS 天線模塊,新增 L5 頻率,以提升定位精度;

(7)新增毫米波雷達接口以及雷達加熱器;

(8)HW4.0 主板整體采用對稱設計,配置均為雙備份;

總體而言,HW4.0 的升級主要集中在 FSD 芯片和傳感器架構。

英偉達 Orin 是 2019 年 12 月推出,特斯拉的二代 FSD 估計是 2020 年開始設計。

兩相對比,誰更優秀,相信聰明的讀者已有答案。


相關推薦

2023-02-14

特斯拉新品發佈在即——而且是最核心的車載計算機系統。德國特粉們扒出特斯拉在向歐洲監管機構提交的車輛變更申請,坐實新車型傳聞:最新自動駕駛硬件HW4.0,新的芯片、新的傳感器,當然還有無奈之下請回來的毫米波雷

2023-02-24

減少Model 3內部的零部件數量,並降低車身的復雜程度,特斯拉用戶看重的顯示屏也可能迎來調整,屆時改款車型的外觀、內飾以及傳感器數量,都有可能變化。此外,幾天後就是特斯拉投資日,屆時將公佈特斯拉宏圖計劃的第

2022-09-23

這意味著Thor每秒將進行2000萬億次的運算。要知道,目前特斯拉的FSD(完全自動駕駛)自研芯片的算力為144 TOPS,Thor的算力約為前者的14倍。GPU霸主英偉達,攜算力優勢殺入汽車芯片市場,正在對全行業降維打擊。面對英偉達的

2022-09-21

和本地離線計算應用程序。值得一提的是,Orin Nano 采用與英偉達先前宣佈的 Orin NX 兼容的模塊,支持 2020 年問世的 Ampere GPU 架構的 AI 應用程序管道。感興趣的開發者可於明年 1 月入手兩個版本,其售價為 199 美元。其中 Orin Nano

2023-01-04

國品牌比亞迪、韓國品牌現代和瑞典品牌極星將成為首批與英偉達合作在其車輛中提供GeForceNOW雲遊戲服務的汽車制造商。宣傳視頻:據悉,比亞迪將在2023年上半年開始,在生產的新能源汽車上搭載NVIDIA DRIVE Hyperion平臺;擁有現

2024-04-08

一起來看看OrinX、8295芯片到底長什麼樣,PCB做工如何,和特斯拉比到底是什麼水平。首先可以看到,小米SU7的兩大主控——智能駕駛主控、車機主控(智能座艙控制器)均在副駕駛手套箱下方,需要將整個扶手箱完全拆開,才能

2023-11-22

理想可能不會采用目前應用廣泛的 GPU 架構,而是采用與特斯拉 AI 超級計算機 Dojo 或者 AI 芯片初創公司 Tenstorrent 類似的架構。上述人士表示,“謝炎是做編譯器出身,希望能夠用軟件調度實現降維打擊,提高利用率。”特斯拉

2023-02-16

日前,馬斯克宣佈將在3月1日的特斯拉投資者日活動中,公佈特斯拉宏圖第三篇章(MasterPlanPart3),其中或許包含新一代的特斯拉FSD自動駕駛系統。近日,特斯拉全新HW4.0電腦板曝光,相比現在HW3.0,新電腦板變化非常大。第一、

2022-09-22

駛芯片都會合二為一。本來或許能在車上互不幹涉的高通與英偉達,也必將成為敵人。近年來,高通也在車機之外的領域發佈驍龍數字底盤以及自動駕駛芯片。大廠的競爭況且如此,一些小廠的路恐怕要更難走。

2023-11-20

代產品,征程6系列,旗艦單顆算力為560TOPS,算力超兩顆英偉達OrinX,針對智能駕駛的算法底座Transformer做適配設計。將於明年4月正式發佈,目前意向合作車企已經有理想,大眾,廣汽,比亞迪。同時在Tier 1迎來新的合作夥伴:

2023-01-16

“8顆攝像頭搞定所有”,馬斯克一直這樣佈道特斯拉的FSD傳感器方案。但佈道歸佈道、願景歸願景,現實是現有方案撐不住FSD,情況又有新變化——最新曝光的特斯拉文件,據稱還是特斯拉中國的內部文件,其中信息顯示:特

2024-05-25

經開始——我們欣喜地看到,越來越多的公司和國傢正在與英偉達緊密合作,將傳統數據中心轉型為加速計算中心,並構建新型的AI工廠。這將為我們生產一種全新的商品——AI,它將為幾乎每個行業帶來顯著的生產力提升,幫

2022-08-04

程序和相關產品推向市場的開發者與企業來說,現可選用英偉達JetsonAGXOrin32GB量產模塊來應對挑戰。借助合作夥伴的廣泛產品,開發人員得以構建和部署功能豐富的Orin驅動系統,並涵蓋邊緣AI、機器人、AIoT,以及運動相機、傳感

2024-03-22

超級計算機,但他旗下公司與英偉達的關系卻日益緊密,特斯拉和xAI都在大規模采購英偉達的硬件產品。2023年11月,2023年11月,蘋果和迪士尼為抗議X平臺上增加的反猶和其他形式的仇恨言論,暫停廣告投放。面對是否跟進的問