大模型開車哪傢強?普渡研究給指南:GPT-4真行啊


現在一句口令,就能指揮汽車。比如說聲“我開會要遲到”“我不想讓我朋友等太久”等等,車就能理解,並且自動加速起來。如果這次行程有不滿意的,隻需要給汽車提供反饋建議:“要在充分保障安全的前提下”,汽車的自動駕駛行為就會在下次行程中進行自我修正。



這是來自普渡大學數字孿生實驗室最新研究——

讓大語言模型部署在自動駕駛實車上,在多個交通場景,比如停車場、十字路口和高速上理解乘客的各種個性化指令,構建他們的數字孿生。

最終在眾多大模型的實驗中,GPT-4脫穎而出。

更多細節在此。基於LLM的自動駕駛系統

而這背後的實現,主要來自於一個框架Talk2Drive。


這個框架主要有三個特點:

1、它將人類口頭命令轉換為文本指令,然後由雲端的大模型來處理。在此過程中會用到一些語音識別的開源API,比如Whisper,準確捕獲口令並翻譯成文本。雲上的大模型結合天氣、交通狀況和當地交通規則等信息,生成上下文駕駛數據。

2、大模型生成特定的自動駕駛代碼,隨後發送回車輛的電子控制單元(ECU)並在其中執行。

代碼執行涉及調整基本駕駛行為以及車輛規劃和控制系統中的各種參數。

隨後,車輛的執行器通過CAN總線和線控系統控制油門、剎車、檔位選擇和轉向。

3、車輛的存儲模塊秉承”千人千面“的理念,記錄著所有人車交互數據,確保每次行駛體驗都是基於乘客的歷史偏好和實時命令進行定制,實現真正意義上的數字孿生個性體驗。


經過一眾大模型對比,他們最終選擇GPT-4,因為它的延遲相對較小,以及推理能力更強。


在Talk2Drive 系統中,三類不同駕乘偏好的乘客以口頭化的指令表達與大模型進行交互,以促使系統做出相應調整。當乘客對調整後的自動駕駛行為不滿意時會關閉自動駕駛模式,系統也會記錄這種情況下的 “接管”。

結果顯示,無論駕乘偏好如何,Talk2Drive都能顯著降低接管率。


這輛全副武裝的自動駕駛車和大語言模型API協作完成這次研究。


來自普渡大學數字孿生實驗室

這項研究來自普渡大學數字孿生實驗室。


從研究團隊來看,大部分都是華人面孔。

其中一作Can Cui目前是普渡大學一年級博士生。在加入普渡大學工程學院之前,在密歇根大學獲得電氣與計算機工程碩士學位。本科畢業於武漢理工大學。

其導師王子然博士,在2022年加入普渡大學之前,曾在豐田矽谷研發中心任職四年,以主任研究員的身份領銜數字孿生的相關研究。

據介紹,普渡數字孿生實驗室從2023年6月開始深耕大語言模型和自動駕駛交叉領域,進行包括文獻綜述、創立公開數據集、仿真環境測試、以及主辦研討會等一系列工作。


相關推薦

2024-04-18

ing”的研究中,使用“弱智吧標題+GPT-4回答”微調後的大模型評估結果,超過他們收集的其他有監督微調(SFT)指令集數據。後者來自包括知乎、百科、豆瓣、小紅書等社交平臺。對此,業內人士表示“看論文看到哈哈大笑”。

2023-04-01

以點擊文章最後的視頻號卡片觀看。ChatGPT這樣的大語言模型,理解的語言到底是什麼?要解釋這個問題,或許就需要知道ChatGPT到底是怎麼“說話”的。這可以從GPT三個字母的全稱,Generative Pre-trained Transfomer(生成型預訓練變換

2024-03-06

晚,被稱之為是OpenAI最強競爭對手的Anthropic發佈其最新大模型系列Claude3。該系列包含三個模型,能力由強至弱分別是Claude3Opus(著作)、Claude3Sonnet(十四行詩)和Claude3Haiku(俳句)。Anthropic發佈的跑分顯示,Opus在多項基準測試

2023-11-05

1分鐘不到、20步以內“越獄”任意大模型,繞過安全限制!而且不必知道模型內部細節——隻需要兩個黑盒模型互動,就能讓AI全自動攻陷AI,說出危險內容。聽說曾經紅極一時的“奶奶漏洞”已經被修復:那麼現在搬出“偵探漏

2024-03-06

AI界的“炸圈”新聞,當屬OpenAI勁敵Anthropic推出Claude3系列模型,真正做到與GPT-4全面掰手腕。要知道,從OpenAI去年3月發佈“最強大模型”GPT-4到今天,整整一年來,這是第一款真正挑戰到其天花板地位的模型,不僅評測成績通通

2023-11-09

冷,勝負難分。GPT成國內廠商的靶子。幾乎每傢在發佈大模型時,都要把GPT拉出來對比一波,而且他們總能找到一個指標把GPT超越——比如,中文能力。測評類的榜單太多。從英文的MMLU,到中文的SuperCLUE,再到借鑒遊戲排位賽

2023-11-25

是 Roadster 所有的開發文件。比如說,有人想去看看三維模型,發現文檔裡並沒有。還有人去找整車裝配的東西,也沒找到。就這些文件看下來,我感覺如果你全都研究完的話,能不能造一臺 Roadster 還不好說,但應該可以去修一

2023-03-17

財報電話會上,李彥宏就曾提到,相比海外開發的大語言模型,文心一言的比較優勢在於更理解中國文化,更適合中文和中國市場。而且,在多模態生成方面,GPT-4隻是做到能夠實現圖片輸入,輸出形式上仍隻有文本一種形態。

2023-03-16

度文心一言終於揭開神秘面紗。3月16日,百度基於文心大模型技術打造的生成式對話產品——文心一言正式亮相。據百度創始人、董事長兼CEO李彥宏介紹,文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成

2023-03-16

已經具備的能力。北京時間3月15日凌晨,OpenAI正式發佈該模型。簡單來說,GPT-4與前代相比可以接受的文本輸入上限更高,回答的準確性提高,能夠生成歌詞、創意文本等多樣化風格的內容。最最最令人振奮的是,GPT-4有強大的

2024-04-15

自從2023年11月Grok首次亮相以來,馬斯克的xAI正在大模型領域不斷取得進步,向OpenAI等先行者發起進攻。在Grok-1開源後不到一個月,xAI的首個多模態模型就問世。昨天,xAI推出Grok-1.5V,該模型不僅能理解文本,還能處理文檔、圖

2023-03-16

北京時間3月15日凌晨,OpenAI正式官宣大模型GPT-4。在驚艷到出圈的ChatGPT推出後僅僅4個月,OpenAI再推新品。這似乎正在印證此前傳出的“OpenAI計劃2023年營收2億美元,2024年底前營收達10億美元”的目標。限制盈利機構OpenAI要開始用

2024-04-22

計一個黑客智能體框架,研究包括GPT-4、GPT-3.5和眾多開源模型在內的10個模型。結果發現隻有GPT-4能夠在閱讀CVE漏洞描述後,學會利用漏洞攻擊,而其它模型成功率為0。91行代碼、1056個token,GPT-4化身黑客搞破壞!測試成功率達87%

2024-02-02

該團隊於去年秋天成立,目的是評估該公司前沿人工智能模型的風險和潛在濫用。OpenAI 的研究結果似乎反駁科學傢、立法者和人工智能倫理學傢的擔憂,即像 GPT-4 這樣強大的人工智能模型可以為恐怖分子、罪犯和其他惡意行為