與蔚來、小鵬相比,理想的車上市時間最晚,但是銷量最高。理想預測今年的銷量有望達到38萬輛。今年前10個月,理想的銷量已經超過蔚來、小鵬的總和。在軟件自研方面,理想的起步也比較晚,但目標最高。今年1月,理想汽車CEO李想在公司開年內部信中說,理想汽車的願景是在2030年成為“全球領先的人工智能企業”。
“具備自動駕駛(能力)的智能電動車將成為最早的人工智能機器人,以及創造出物理世界人工智能的母生態:從 AI 的算法到改變生活的 AI 產品,從 AI 操作系統到 AI 推理芯片,從 AI 訓練平臺再到 AI 訓練芯片等。” 李想表示。
理想正在加大投入力度,補齊智能化方面的短板。在今年三季度業績電話會上,理想汽車總裁兼總工程師馬東輝表示,理想將把 “智能駕駛領先” 作為核心戰略目標,到 2025 年,理想智能駕駛研發團隊規模預計由目前的約 900 人擴張至超過 2500 人。
在芯片自研方面,理想也在加大投入。理想同時在研發用於智能駕駛場景的 AI 推理芯片,和用於驅動電機控制器的 SiC 功率芯片。
有知情人士對《晚點Auto》表示,理想目前正在新加坡組建團隊,從事 SiC 功率芯片的研發。在職場應用 LinkedIn 上,已經可以看到理想近期發佈的五個新加坡招聘崗位,包括:總經理、SiC 功率模塊故障分析 / 物理分析專傢、SiC 功率模塊設計專傢、SiC 功率模塊工藝專傢和 SiC 功率模塊電氣設計專傢。
用於智能駕駛的 AI 推理芯片是理想目前的研發重點。《晚點 Auto》解到,理想研發整個 SoC(System on a Chip,系統級芯片),其中最關鍵的環節是推理模型加速單元 NPU 的前端設計。理想計劃把後端設計部分外包給臺灣世芯電子,然後再交由臺積電完成制造。
《晚點 Auto》解到,今年 10 月下旬,理想智能駕駛芯片研發團隊已經在上海完成集結並封閉,準備突擊流片。在芯片行業,“流片” 即試生產,意思是在研發團隊設計完電路以後,先生產少量供測試用的芯片。
目前理想芯片部門的總體人員規模在 160 人以上,分佈在北京、上海,美國矽谷和新加坡。一些部門已經開始執行 “大小周”(單雙休循環)機制。
理想芯片團隊屬於 “系統與計算群組”,該群組負責人為理想 CTO 謝炎。芯片團隊下設 NPU 架構、SoC、後端設計、驗證等部門,芯片研發負責人為羅旻,職級為高級總監,向謝炎匯報。
凡專傢級以上的崗位招聘,均需謝炎面試,高級專傢級以上的崗位需經過李想親自面試。
《晚點 Auto》將上述信息向理想汽車官方求證,截至發稿,未獲回復。
先做智能駕駛芯片,雲端芯片也討論過
業內目前研發的智能駕駛芯片,通常指的是一個高度集成的系統級芯片,由多種芯片模塊組成,包括推理模型加速單元(NPU)、中央處理單元(CPU)、圖像信號處理器(ISP)、動態隨機存取存儲器(DRAM)等。
理想自研的芯片,正是用於智能駕駛場景的系統級芯片,以推理模型加速單元 NPU (Neural Processing Unit,神經處理單元)為研發重點。
NPU 是一種主要用來加速神經網絡的推理計算,是智能駕駛芯片中最能做出差異化的核心模塊。
通用芯片側重於靈活性,具備處理多種指令要求的能力。而專門用途芯片可以針對 AI 算法采取特殊設計,具備體積更小、功耗更低、可靠性更高等優點,但研發周期往往更長、研發費用也會更高。
據《晚點 Auto》解,理想芯片部門 NPU 架構的研發負責人陳飛於 2022 年 4 月加入理想,目前的職級為資深專傢。陳飛本科畢業於清華大學工程物理系,博士畢業於美國特拉華大學電子與計算機工程系,曾在英特爾、ARM、蘋果和Google從事 CPU 和其他芯片的設計開發工作。
理想汽車官網顯示,其正在通過社會招聘渠道招募 NPU 相關技術人才,列出的全職崗位包括 NPU 運行時軟件工程師、NPU IP 設計、NPU 調度器技術專傢、NPU 架構師和 NPU 驗證工程師,工作地點均位於上海浦東新區。
《晚點 Auto》解到,在智能駕駛芯片自研過程中,理想內部團隊主要做含金量更大的前端設計,目前把後端的物理設計部分外包出去。與此同時,理想也在自建後端設計團隊。
後端是把前端的邏輯設計轉成物理設計,相當於把電路原理圖轉成線路圖。國產車載芯片廠商芯礪智能首席戰略官陳超卓表示,由於行業內已經具有成熟的工藝和流程管控標準,把後端外包出去可以節省時間和成本,是行業內的習慣做法。
今年 7 月,《臺灣時報》曾援引摩根士丹利研報報道稱,理想計劃把智能駕駛芯片的後端設計部分外包給臺灣世芯電子。據解,芯片的後端設計定型後,將交由臺積電完成制造。
世芯電子官網信息顯示,其目前主要向客戶提供 ASIC 專業使用芯片設計、系統級芯片 SoC 設計等服務。世芯電子成立於 2003 年 2 月,2009 年通過臺積電認證,2014 年 10 月上市,2021 年 1 月在北京設立辦公室。在成立之初,世芯電子曾獲得臺積電、思科和軟銀等科技公司的投資。
一位接近理想汽車的人士對《晚點 Auto》強調,理想車端推理芯片的研發工作較為復雜,在 NPU 、SoC 等硬件以外,還包括軟件的開發與適配等,“這實際上是一個好多層的解決方案”。
除車端推理芯片外,理想也曾討論過自研用於數據中心的雲端訓練芯片。一位知情人士認為,在雲端訓練芯片的技術路線選擇上,理想可能不會采用目前應用廣泛的 GPU 架構,而是采用與特斯拉 AI 超級計算機 Dojo 或者 AI 芯片初創公司 Tenstorrent 類似的架構。上述人士表示,“謝炎是做編譯器出身,希望能夠用軟件調度實現降維打擊,提高利用率。”
特斯拉曾在 2021 年 AI DAY 活動上宣稱,其超算 Dojo 采用的 D1 芯片基於 ASIC 專業使用芯片的思路打造,兼具性能與成本優勢。
在理想汽車 2023 年春季媒體溝通會上,李想曾表示:“像特斯拉做自己的 AI 訓練芯片 D1,它整個體系構建起來以後,大概能做到英偉達 A100 六分之一的成本。”
截至今年 8 月中旬,據《晚點 Auto》解,理想管理層仍未對雲端訓練芯片的自研作出詳細規劃。
跟著特斯拉做芯片
2022 年 6 月,陳飛曾在一場理想汽車舉辦的校園招聘活動上提出,未來智能駕駛芯片應該具備七大特征:算力大、可擴展性高、軟件編程容易、靈活度高、功耗低、可靠性高、成本低。
在智能駕駛芯片領域,業內有望實現較現有已量產芯片 5-10 倍的性能提升。
他認為目前的芯片並不能把性能做到極致,一個重要的原因是,芯片廠商要考慮通用化,面向整個行業設計制造芯片,而每一傢主機廠用的模型可能都不一樣,這就會造成一些浪費,很難達到 “量身定制” 的效果。“沒辦法,市面上能夠買到的性能最好的芯片,也就隻有英偉達的這種芯片。” 陳飛說。
此外,服務器或手機芯片領域頭部廠商的策略,都是在自己原有優勢架構的基礎上加上 AI 推理加速的能力,希望做出一款產品,讓汽車廠商都能夠高效運用。但是,傳統 CPU 和 GPU 架構的設計初衷並非針對智能駕駛這個應用場景,如果用來跑智能駕駛推理應用,芯片的功耗會很大,進而影響在高溫狀態下的整體性能。
“GPU 原來主要是為圖形渲染、3D 加速而設計的,其計算能力比 CPU 會好一些,但是具體到智能駕駛的應用上面,也已經顯得有些力不從心。” 陳飛表示。
特斯拉是全世界第一個自研智能駕駛芯片的車企。早在 2016 年,特斯拉與 Mobileye 合作期間,就從 AMD 挖來芯片產業傳奇人物 Jim Keller。當時特斯拉 Model S、Model X 上的自動駕駛硬件系統是 2014 年發佈的 Hardware 1.0,搭載 Mobileye EyeQ3 芯片,軟件算法主要由 Mobileye 提供。
不過,雙方的合作並不順暢:Mobileye 認為,特斯拉釋放給用戶的功能過於激進;特斯拉則認為,Mobileye 對於研發需求的響應程度不足。2016 年 5 月,在美國佛羅裡達高速公路上發生的交通事故加劇雙方合作的嫌隙。
2016 年 10 月,特斯拉推出用定制版的英偉達 Drive PX2 自動駕駛計算平臺(由 1 顆 Tegra Parker 芯片和 1 顆 Pascal 架構 GPU 芯片構成)打造的 Hardware 2.0 ,與 Mobileye 徹底分手。2017 年 8 月,特斯拉又增加一顆英偉達 Tegra Parker 芯片,將 Hardware 2.0 升級為 Hardware 2.5。
與英偉達合作期間,特斯拉的智能駕駛軟件能力不斷進化,對芯片的理解也不斷加深。2019 年 3 月,特斯拉量產基於 2 顆 FSD 芯片的 Hardware 3.0,FSD 芯片由特斯拉自研,采用 14nm 制程,單顆算力 72 TOPS。
根據特斯拉公佈的數據,與采用英偉達芯片的 Hardware 2.5 相比,Hardware 3.0 的圖像處理速度提升約 21 倍(每秒處理幀數由 110 幀提升至 2300 幀),單體成本降低 20%,功耗僅為原來的 1.26 倍(從 57W 增加到 72W)。
特斯拉 FSD 芯片,來源:特斯拉 2019 年 Autonomy Day。
目前,FSD 芯片已在特斯拉全系車型上大規模搭載,累計出貨量超過 800 萬顆。多位業內人士對《晚點 Auto》表示,從應用角度來說,特斯拉 FSD 芯片是目前最先進的智能駕駛車端推理芯片。
除車端推理芯片,特斯拉還自研雲端訓練芯片。2021 年 8 月,特斯拉在 AI DAY 上正式發佈 Dojo 超算,以及自研的雲端訓練芯片 D1 。至此,特斯拉將應用於數據中心場景的芯片研發主動權也拿到自己手中。
根據特斯拉官方此前發佈的信息,特斯拉 Dojo 超算已從今年 7 月開始量產,到 2024 年 2 月,總算力將達到等效約 10 萬張英偉達 A100 芯片,進入全球前五;到 2024 年 12 月,Dojo 的總算力將達到 100 EFLOPS,等效約 30 萬張英偉達 A100 芯片。
性能方面,相較於采用 GPU 路線的英偉達 A100 ,在熱設計功耗 TDP(Max Thermal Design Power)相同的情況下,特斯拉 D1 以更小的芯片面積和更少的晶體管數量,實現更高的峰值算力。
自研與否,最終要回歸商業模式
特斯拉把 FSD 芯片量產之後,中國新勢力理想、蔚來、小鵬都組建自己的芯片團隊。
李想曾在理想汽車 2023 年春季媒體溝通會上解釋稱,在系統的研發方面,車企需要關註平臺的成本如何繼續下降。在智能駕駛的硬件(包括雷達、攝像頭等傳感器和計算平臺)成本上,特斯拉是 1500 美元,理想是 4000 美元。
“如果理想自己做推理芯片,可以做到像特斯拉一樣的成本,因為算法掌握在自己的手裡,也包括後面整個的訓練平臺、訓練芯片自己做。” 李想當時表示。
復雜多變的國際環境,也讓芯片自研更具合理性。
一位接近理想的人士對《晚點 Auto》分析稱,“如果理想短時間內不推動智能駕駛芯片自研,而是一直使用英偉達的芯片,並不會很快出現性能瓶頸,但是英偉達的芯片價格高,而且存在斷供風險。”
當前,智能駕駛雲端訓練芯片斷供已經成為中國多傢車企和自動駕駛研發商面臨的真實風險。
10 月 18 日,美國商務部下屬工業安全局發佈公告稱,將擴大對華出口先進芯片的管制范圍,受限芯片產品包括但不限於 A100、A800、H100、H800、L40、L40S 和 RTX4090 。其中,A100、A800、H100、H800 等芯片可被用於智能駕駛的雲端訓練。
10 月 24 日,英偉達發佈公告稱,美國政府已通知英偉達,上述芯片出口禁令立即生效,撤回 30 天豁免期安排。
智能駕駛雲端算力競賽是頭部廠商的另一個角力場。6 月 17 日,在理想汽車舉辦的 “傢庭科技日” 活動上,理想智能駕駛副總裁郎咸朋曾表示,理想智能駕駛數據中心的雲端算力規模已達 1200 PFLOPS。
11 月 10 日,在阿維塔 12 的新車上市發佈會上,華為車 BU 董事長餘承東表示,華為智能駕駛雲端算力規模已達 2800 PFLOPS。
自研芯片的好處很多,風險也不小。
首先,智能駕駛芯片的技術路線仍未收斂,廠商研發出的產品有可能在量產後很快遭到淘汰。
陳飛曾表示,現階段的智能駕駛模型,主要是基於卷積神經網絡(CNN, Convolutional Neural Networks)設計。但是,隨著學術界、工業界的發展,模型的推理方式可能會發生改變,如果硬件設計隻對當前專精於某一類型的模型服務,那麼當更優秀的模型出現時,這個花費大量資源開發出來的芯片可能就會過時。
因此,在設計智能駕駛芯片時,廠商必須要考慮到模型發展的趨勢,讓整個系統保持一定的靈活性和可擴展性。這樣,當新模型出來時,芯片也能夠在現有架構上對其完成適配,讓新模型高效運行。
其次,智能駕駛等高算力芯片的研發周期長、資金投入大,不確定性高,如果盲目推進芯片自研,也會給企業造成很大負擔。
陳超卓表示,研發芯片特別 “燒錢”,一顆高算力芯片的研發和量產需要花費十幾億元人民幣甚至更高。從商業模式的角度講,芯片廠商的毛利率必須超過 50% 才能生存。而車企自研的芯片一般隻能自用,由於行業發展速度快,可能一顆芯片隻能搭載在一兩代車型上,如果銷量不夠大,商業模式很難撐得住。
再者,車企自研智能駕駛芯片的最終目的,是實現商業利益最大化,但在芯片出貨量上,多數車企比不過為行業提供通用方案的頭部芯片廠商。
在 2023 年中國電動汽車百人會論壇上,地平線創始人兼 CEO 餘凱曾表示,車企應該慎重考慮自研智能駕駛芯片問題。“自研和他山之石本身是戰略選擇,如果車廠的年銷量預期不到 100 萬輛,資金的整個效率其實是算不過賬的。”
陳超卓認為,特斯拉從使用供應商的方案轉為自研,是因為供應商的方案滿足不特斯拉的要求。通過自研芯片,特斯拉確實已經形成一定的成本和技術優勢。但如果將來有一天,智能駕駛芯片產業變得更加成熟,行業通用方案能夠滿足車企的要求,車企自研芯片就不具備優勢。
行業研究機構 IDC 中國研究經理王博對《晚點 Auto》表示,智能駕駛涉及復雜的行業生態,對於車企而言,不論以自研路線為主,還是與科技公司尋求合作,在芯片領域的技術積累都有利於其在未來的競爭中爭取更大的主動權。