在近期舉辦的2024理想AI TALK活動中,理想汽車的首席執(zhí)行官李想分享了他對人工智能與自動駕駛技術的獨到見解。他透露,理想汽車將于12月31日正式推送全新的OTA7.0升級,此次升級的核心亮點在于高速城市全場景智能駕駛的端到端技術升級,以及VLM(視覺語言模型)的引入。
對于此次技術迭代,周光在之前的專訪中使用了生動的比喻來解釋。他將“端到端+VLM”模型比作是教練指導學員開車,教練通過語言指令來引導學員,但這種方式可能會因為溝通不及時而出現誤差。相比之下,VLA(視覺語言行動)模型則更像是教練親自駕駛,更加熟練和高效。VLA模型通過將VLM與端到端智能駕駛模塊整合,直接接收傳感器數據并輸出駕駛軌跡給控制系統(tǒng),實現了智能駕駛的進一步優(yōu)化。
周光還強調,VLA模型的成功不僅依賴于強大的算力支持,如英偉達Thor芯片,還需要大量的數據積累。他指出,一個智能駕駛公司至少需要交付上萬輛汽車才能進行端到端1.0(即“端到端+VLM”)的迭代,而要實現VLA架構的模塊,則需要至少10萬輛級的量產車數據。
在量產車規(guī)模方面,元戎啟行已經取得了顯著的進展。截至目前,他們搭載的量產車數量已超過3萬臺,僅在12月,全新藍山的銷量就達到了8057輛,同比增長高達214.24%。元戎啟行還在與多個量產項目合作,預計年底前至少會有三款搭載其智能駕駛系統(tǒng)的車輛進入市場。
對于VLA模型的前景,周光充滿信心。他認為,VLA模型將賦予智能駕駛系統(tǒng)更長時間的推理能力和更強的可解釋性,這將是一次顯著的性能提升。同時,商湯絕影的首席執(zhí)行官王曉剛也對VLA技術表示了認可,但他也指出,端到端技術的發(fā)展還需要經歷一個逐步成熟的過程,包括基礎設施的完善、數據的積累與仿真等。
值得注意的是,VLA模型與傳統(tǒng)的通過制定規(guī)則訓練的模型有著本質的區(qū)別。VLA模型的內核是AI神經網絡,這使得它具有更強的AI屬性和更高的性能天花板。多位業(yè)內人士都認為,VLA模型將是未來智能駕駛發(fā)展的大方向。
隨著2025年的到來,汽車行業(yè)正迎來“智能化”競爭的下半場。無論是理想汽車的端到端+VLM、元戎啟行的VLA,還是小鵬、商湯等企業(yè),都已經在智能駕駛領域明確了技術路線和布局。對于那些未能贏在起跑線的企業(yè)來說,他們正面臨著更加緊迫的挑戰(zhàn),需要加快步伐,以爭取在激烈的市場競爭中占據一席之地。