最近這段時間,車企們也開始學互聯網企業,玩起大模型。比如理想的自研大模型MindGPT,廣汽的AI大模型平臺,以及吉利的全棧自研全場景AI大模型等等。甚至自己做不的,也得找人去合作。像是東風日產、紅旗、長城這些,就宣佈接入百度的“文心一言”。
不過,這些車企們到底是純純搞營銷還是真的有東西,脖子哥還得仔細看看。
就目前而言,大多數車企還隻規劃座艙的語音功能,說白,就是做 ChatGPT 的語音版。
用上的話,語音助手確實會比以往更聰明一點。
比如百度的文心一言,據說搭載上車之後,可以一邊在車上電話開會,一邊自動記錄會議紀要,並且完成簡單的 PPT 制作。
那麼……打工人就算開車也沒理由不幹活,百度是懂加班的。
而吉利的這個全場景 AI 大模型就更有意思,說是有主動搭訕、自動唱歌以及哄娃等能力。
但,用車機語音搭訕和自我營銷,真的有人會用這個功能嗎?他的精神狀態真的還好嗎……
相比他們,一些車企已經到第二層,開始用大模型做智駕。
這裡面可就大有說法。目前比較普遍的做法,是將大模型作為工具,輔助汽車的智駕訓練,其中關鍵是訓練智駕系統的應變能力。
目前智駕系統還不能保障 100% 的自動駕駛安全性,是因為存在 AI 還沒見過的場景,一旦遇到這種情況, AI 就容易 “ 把 CPU 給幹燒 ” ,大多數自動駕駛的安全事故都是這樣發生的,這個情況被稱作 Coner case 。
為解決一個 Coner case ,必須得經歷數據預處理、數據標註、模型訓練和模型仿真等過程,需要用上萬的樣本數據以及數周時間進行測試,費時費力。
過去用來訓練 AI 的數據基本來自真實數據,但是由於 Coner case 發生的概率非常低,要找到世界各地出現的相同 Coner case 並不容易。
用上大模型之後,AI 就可以幫助構建虛擬空間,自動生成訓練場景,可以大幅縮減成本。
比如華為的盤古大模型,會根據路采數據進行重建,生成可編輯的虛擬空間,將原來兩周左右的 Coner case 處理過程縮減到兩天內。
但這還不夠,另一些車企選擇更為激進的做法,直接選擇用大模型開幹智駕。
這就不得不提到特斯拉的 FSD 。
早在 2021 年,特斯拉就采用BEV (鳥瞰圖)+ Transformer 的智駕算法,可以說是在車企裡用大模型做智駕最早的一批。
咱先不說這套智駕系統的原理是啥,先看這個 Transformer ,其實指的就是大模型架構, ChatGPT 就是基於這個架構生成的。
Transformer 模型架構和傳統神經網絡的區別在於,加入 “ 註意力機制 ” ,舉個例子,咱們在讀一句話的時候,有些字很關鍵,有些字不關鍵,隻要看這些關鍵字,就容易 get 到整個句子的含義,即使個別字寫反,也不影響最終理解的結果。
因此 Transformer 就會對一句話中的每個字設置權重,最後對全文的理解根據每個字加權平均算得,準確性就相對更高。
這套模型架構將主要用於 FSD 的純視覺感知算法,幫助系統將 2D 的攝像頭視頻數據融合轉化成 3D 的鳥瞰圖,從而自行判斷合理的行駛路線。
然而,就算這套大模型智駕方案擁有更高的泛化能力(舉一反三的能力),特斯拉的 FSD 還是會遇到各種 Coner case 。
比如在今年的 8 月 26 日,馬斯克在直播測試自動駕駛時,AI 把左轉車道的綠燈當成前進的綠燈,打算筆直穿過路口,此時的老馬不得不主動介入剎停,才避免釀成事故。
要知道這可是當眾直播啊!先不說觀眾對 FSD 系統的質疑,就算評論問起應如何解決故障時,老馬也隻能說“ 將投喂更多樣本數據 ” 。
因為壓根沒有什麼直接當的解決辦法,畢竟模型是一個黑箱,沒有人能在裡面微操,除繼續訓練還真沒有什麼別的辦法。
所以,大模型做智駕的主要問題,依然是處理不完的各種 Coner case ,未來的智駕大模型還得繼續在泛化能力上進行升級。
不僅如此,大模型做智駕的另一個難處就是錢。
特斯拉之所以能用上 Transformer ,關鍵是有 72 TOPS 算力的 HW3.0 芯片作為支撐。而現在一些車企用的都是英偉達 orin 芯片,它的算力更是達到 254 TOPS,今後隨著模型越來越大,對智駕芯片的算力要求也會越來越高,這意味著車主就要為智駕掏更多的錢。
在研發方面,之前一些企業訓練大模型用的都是 GPU 芯片,但現在都開始用上 TPU ,功能越強的大模型研發難度越大,普通車企恐怕很難保持長時間的自研過程,與互聯網巨頭合作說不定會更加現實。
不過特斯拉在這上面算是鐵心,最近,FSD 又進行一次全面的算法更新,打造一個 “ 端到端 ” 的智駕模型,把整個智駕過程融入到一個算法和模型裡面,這可能是未來各大車企做智駕大模型的一個方向。
要知道,過去的智駕算法是分成三個部分的,感知、決策和執行各司其職,如果將其整合在一起,那麼成本會更低,智駕反應也會更快。
隨著技術一次次迭代,也真說不好,什麼時候就能把智駕大模型最後的安全難關給攻破。
但在此之前,一定是一段非常艱難且痛苦的過程。
要脖子哥說,“ 大模型上車 ” 這玩意兒確實有用,但能發揮出幾分功力,還得看各傢車企的實力吧。