近期,科技界迎來了一波關(guān)于世界模型的創(chuàng)新浪潮,其中,由人工智能領(lǐng)域的領(lǐng)軍人物李飛飛創(chuàng)立的Worlds Labs率先推出了其首個(gè)項(xiàng)目——大世界模型(Large World Model,LWM)。這一技術(shù)能夠通過單張圖片,將二維場(chǎng)景轉(zhuǎn)化為三維空間,用戶可以在其中自由移動(dòng)并切換視角,體驗(yàn)到的場(chǎng)景不僅栩栩如生,還嚴(yán)格遵循空間原理和物理定律。
李飛飛透露,大世界模型僅僅是Worlds Labs邁出的第一步,他們未來的愿景是將這一技術(shù)融入增強(qiáng)現(xiàn)實(shí)(AR)、機(jī)器人技術(shù)乃至自動(dòng)駕駛領(lǐng)域,開啟全新的智能應(yīng)用篇章。
緊接著,Google DeepMind也發(fā)布了其Genie2技術(shù),展示了從單張圖片生成無限3D世界的能力,這一技術(shù)被廣泛應(yīng)用于AI游戲及智能體訓(xùn)練中,展現(xiàn)了模擬虛擬世界、實(shí)現(xiàn)物體交互、復(fù)雜角色動(dòng)畫以及預(yù)測(cè)其他智能體行為的巨大潛力。
隨后,OpenAI在發(fā)布會(huì)上宣布了Sora Turbo的推出,這一技術(shù)是對(duì)此前Sora的升級(jí),旨在模擬運(yùn)動(dòng)中的物理世界時(shí),增強(qiáng)其可編輯能力,標(biāo)志著理解和模擬現(xiàn)實(shí)的基礎(chǔ)性AI技術(shù)取得了重大進(jìn)展。
自2018年世界模型的概念被廣泛關(guān)注以來,科學(xué)家們指出,人類基于有限的感官感知構(gòu)建的內(nèi)部、簡(jiǎn)化世界模型,不僅幫助我們理解世界,還指導(dǎo)我們預(yù)測(cè)未來。計(jì)算機(jī)領(lǐng)域的世界模型同樣遵循這一思維模式,即在有限信息基礎(chǔ)上進(jìn)行有效決策和預(yù)測(cè)。
在汽車行業(yè)中,這一技術(shù)正逐步改變智能座艙和智能駕駛的未來。智能座艙方面,隨著高通8295芯片的普及和AR-HUD技術(shù)的應(yīng)用,3D HMI已成為發(fā)展新趨勢(shì)。用戶可以通過3D方式探索整個(gè)座艙場(chǎng)景,實(shí)現(xiàn)多視角切換,帶來連貫且直接的體驗(yàn),顛覆了傳統(tǒng)的座艙交互和信息呈現(xiàn)方式。
AI在智能座艙中的快速應(yīng)用,正重新構(gòu)建視覺、聽覺、語義等多模態(tài)融合的全新體驗(yàn)。盡管當(dāng)前世界模型在汽車行業(yè)的應(yīng)用尚不成熟,但其潛力已初露端倪。如果將世界模型應(yīng)用于座艙,車輛將能夠感知外界環(huán)境的聲音、光線、溫度等信息,主動(dòng)調(diào)整車內(nèi)環(huán)境,實(shí)現(xiàn)個(gè)性化、沉浸式的座艙體驗(yàn)。
智能駕駛方面,自動(dòng)駕駛端到端大模型已成為車企競(jìng)逐的新焦點(diǎn)。這一模型取代了傳統(tǒng)的感知、描述、預(yù)測(cè)及規(guī)劃模塊,通過統(tǒng)一的神經(jīng)網(wǎng)絡(luò)架構(gòu)實(shí)現(xiàn)環(huán)境感知到車輛控制的全流程自動(dòng)化,使自動(dòng)駕駛更接近人類的真實(shí)駕駛。世界模型為自動(dòng)駕駛訓(xùn)練提供了更低成本、更快開發(fā)速度以及復(fù)雜場(chǎng)景訓(xùn)練的可能性,通過模擬真實(shí)世界環(huán)境的動(dòng)態(tài)變化,提前預(yù)判場(chǎng)景演變,提高訓(xùn)練效率,降低研發(fā)成本。
蔚來汽車的蔚來世界模型(NWM)就是一個(gè)典型例子,它能在極短時(shí)間內(nèi)推演多種車輛可能發(fā)生的軌跡,尋找最佳決策,并持續(xù)更新模型以應(yīng)對(duì)復(fù)雜多變的駕駛環(huán)境。隨著科技公司的不斷推動(dòng)和演進(jìn),世界模型正引領(lǐng)汽車行業(yè)向更加智能化、個(gè)性化的方向發(fā)展。