車企也要搞大模型但他們基本還在第一層

2023-11-20 來自差評發表於業界精選

最近這段時間，車企們也開始學互聯網企業，玩起大模型。比如理想的自研大模型MindGPT，廣汽的AI大模型平臺，以及吉利的全棧自研全場景AI大模型等等。甚至自己做不的，也得找人去合作。像是東風日產、紅旗、長城這些，就宣佈接入百度的“文心一言”。

不過，這些車企們到底是純純搞營銷還是真的有東西，脖子哥還得仔細看看。

就目前而言，大多數車企還隻規劃座艙的語音功能，說白，就是做 ChatGPT 的語音版。

用上的話，語音助手確實會比以往更聰明一點。

比如百度的文心一言，據說搭載上車之後，可以一邊在車上電話開會，一邊自動記錄會議紀要，並且完成簡單的 PPT 制作。

那麼……打工人就算開車也沒理由不幹活，百度是懂加班的。

而吉利的這個全場景 AI 大模型就更有意思，說是有主動搭訕、自動唱歌以及哄娃等能力。

但，用車機語音搭訕和自我營銷，真的有人會用這個功能嗎？他的精神狀態真的還好嗎……

相比他們，一些車企已經到第二層，開始用大模型做智駕。

這裡面可就大有說法。目前比較普遍的做法，是將大模型作為工具，輔助汽車的智駕訓練，其中關鍵是訓練智駕系統的應變能力。

目前智駕系統還不能保障 100% 的自動駕駛安全性，是因為存在 AI 還沒見過的場景，一旦遇到這種情況， AI 就容易 “ 把 CPU 給幹燒 ” ，大多數自動駕駛的安全事故都是這樣發生的，這個情況被稱作 Coner case 。

為解決一個 Coner case ，必須得經歷數據預處理、數據標註、模型訓練和模型仿真等過程，需要用上萬的樣本數據以及數周時間進行測試，費時費力。

過去用來訓練 AI 的數據基本來自真實數據，但是由於 Coner case 發生的概率非常低，要找到世界各地出現的相同 Coner case 並不容易。

用上大模型之後，AI 就可以幫助構建虛擬空間，自動生成訓練場景，可以大幅縮減成本。

比如華為的盤古大模型，會根據路采數據進行重建，生成可編輯的虛擬空間，將原來兩周左右的 Coner case 處理過程縮減到兩天內。

但這還不夠，另一些車企選擇更為激進的做法，直接選擇用大模型開幹智駕。

這就不得不提到特斯拉的 FSD 。

早在 2021 年，特斯拉就采用BEV （鳥瞰圖）+ Transformer 的智駕算法，可以說是在車企裡用大模型做智駕最早的一批。

咱先不說這套智駕系統的原理是啥，先看這個 Transformer ，其實指的就是大模型架構， ChatGPT 就是基於這個架構生成的。

Transformer 模型架構和傳統神經網絡的區別在於，加入 “ 註意力機制 ” ，舉個例子，咱們在讀一句話的時候，有些字很關鍵，有些字不關鍵，隻要看這些關鍵字，就容易 get 到整個句子的含義，即使個別字寫反，也不影響最終理解的結果。

因此 Transformer 就會對一句話中的每個字設置權重，最後對全文的理解根據每個字加權平均算得，準確性就相對更高。

這套模型架構將主要用於 FSD 的純視覺感知算法，幫助系統將 2D 的攝像頭視頻數據融合轉化成 3D 的鳥瞰圖，從而自行判斷合理的行駛路線。

然而，就算這套大模型智駕方案擁有更高的泛化能力（舉一反三的能力），特斯拉的 FSD 還是會遇到各種 Coner case 。

比如在今年的 8 月 26 日，馬斯克在直播測試自動駕駛時，AI 把左轉車道的綠燈當成前進的綠燈，打算筆直穿過路口，此時的老馬不得不主動介入剎停，才避免釀成事故。

要知道這可是當眾直播啊！先不說觀眾對 FSD 系統的質疑，就算評論問起應如何解決故障時，老馬也隻能說“ 將投喂更多樣本數據 ” 。

因為壓根沒有什麼直接當的解決辦法，畢竟模型是一個黑箱，沒有人能在裡面微操，除繼續訓練還真沒有什麼別的辦法。

所以，大模型做智駕的主要問題，依然是處理不完的各種 Coner case ，未來的智駕大模型還得繼續在泛化能力上進行升級。

不僅如此，大模型做智駕的另一個難處就是錢。

特斯拉之所以能用上 Transformer ，關鍵是有 72 TOPS 算力的 HW3.0 芯片作為支撐。而現在一些車企用的都是英偉達 orin 芯片，它的算力更是達到 254 TOPS，今後隨著模型越來越大，對智駕芯片的算力要求也會越來越高，這意味著車主就要為智駕掏更多的錢。

在研發方面，之前一些企業訓練大模型用的都是 GPU 芯片，但現在都開始用上 TPU ，功能越強的大模型研發難度越大，普通車企恐怕很難保持長時間的自研過程，與互聯網巨頭合作說不定會更加現實。

不過特斯拉在這上面算是鐵心，最近，FSD 又進行一次全面的算法更新，打造一個 “ 端到端 ” 的智駕模型，把整個智駕過程融入到一個算法和模型裡面，這可能是未來各大車企做智駕大模型的一個方向。

要知道，過去的智駕算法是分成三個部分的，感知、決策和執行各司其職，如果將其整合在一起，那麼成本會更低，智駕反應也會更快。

隨著技術一次次迭代，也真說不好，什麼時候就能把智駕大模型最後的安全難關給攻破。

但在此之前，一定是一段非常艱難且痛苦的過程。

要脖子哥說，“ 大模型上車 ” 這玩意兒確實有用，但能發揮出幾分功力，還得看各傢車企的實力吧。

車企也要搞大模型但他們基本還在第一層

相關推薦

比亞迪每分鐘入賬121萬日賺1億！全球最大純電車企也要易主

回顧2023，車圈那些“意想不到”的10個瞬間

造車新勢力紮堆購物中心傳統車企為何不去搶地盤？

賈躍亭憑什麼罵高合是行業的恥辱？

蘋果造10年車，為什麼現在選擇放棄？

日本人，到底拆多少中國車？

小米汽車“火爆到限流”：正自建充電樁網絡對標至少4款競品

小米在狂歡發車美國新勢力們卻快不行

無車企幸免地圖測繪上“緊箍咒”

更激烈的價格戰，是友商送給小米汽車的見面禮

車展“唯一車模”爬上車頂不為維權為哪般？

板子打在餘承東身上疼的是任正非

看不上雷達的特斯拉這次自己把臉打腫

一年一度電動車至暗時刻來臨冬天續航骨折真的無解？

車企也要搞大模型 但他們基本還在第一層

相關推薦

車企也要搞大模型但他們基本還在第一層