滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

北大清華等聯(lián)合發(fā)布LLaVA-o1：革新視覺(jué)AI，引領(lǐng)推理計(jì)算新風(fēng)尚

時(shí)間：2024-11-19 13:19:47 來(lái)源：ITBEAR作者：砍柴網(wǎng)編輯：瑞雪 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR】近期，一個(gè)由國(guó)內(nèi)外頂尖學(xué)府及科技企業(yè)組成的科研團(tuán)隊(duì)宣布了一項(xiàng)重要突破：他們成功研發(fā)出名為L(zhǎng)LaVA-o1的視覺(jué)語(yǔ)言模型，該模型以其獨(dú)特的自發(fā)性多階段推理能力，在人工智能領(lǐng)域引發(fā)了廣泛關(guān)注。

LLaVA-o1作為一種創(chuàng)新的視覺(jué)語(yǔ)言模型（VLM），其核心設(shè)計(jì)旨在實(shí)現(xiàn)自主且高效的多階段推理過(guò)程。這一模型不僅擁有高達(dá)110億個(gè)參數(shù)，更基于先進(jìn)的Llama-3.2-Vision-Instruct模型進(jìn)行了深度開(kāi)發(fā)，從而確保了其在處理復(fù)雜視覺(jué)與語(yǔ)言信息時(shí)的強(qiáng)大能力。

在推理過(guò)程中，LLaVA-o1采用了創(chuàng)新的階段級(jí)束搜索技術(shù)。這一技術(shù)能夠在每個(gè)推理階段生成多個(gè)候選答案，并通過(guò)智能篩選機(jī)制，從中選取最佳答案。這一特性使得LLaVA-o1在處理復(fù)雜任務(wù)時(shí)，能夠展現(xiàn)出超越傳統(tǒng)視覺(jué)語(yǔ)言模型的卓越能力。

據(jù)研究團(tuán)隊(duì)介紹，LLaVA-o1在多模態(tài)推理基準(zhǔn)測(cè)試中，相較于基礎(chǔ)模型，性能提升了8.9%，這一成績(jī)不僅超越了眾多大型和閉源的競(jìng)爭(zhēng)對(duì)手，更在復(fù)雜視覺(jué)問(wèn)答任務(wù)中突破了傳統(tǒng)模型的局限性。

LLaVA-o1的推出，不僅填補(bǔ)了文本和視覺(jué)問(wèn)答模型之間的空白，更在多個(gè)基準(zhǔn)測(cè)試中取得了優(yōu)異表現(xiàn)。特別是在數(shù)學(xué)和科學(xué)視覺(jué)問(wèn)題的推理領(lǐng)域，該模型展現(xiàn)出了結(jié)構(gòu)化推理在視覺(jué)語(yǔ)言模型中的重要性。這一成果不僅為人工智能領(lǐng)域帶來(lái)了新的突破，更為未來(lái)智能系統(tǒng)的設(shè)計(jì)和開(kāi)發(fā)提供了寶貴的經(jīng)驗(yàn)和啟示。

值得注意的是，LLaVA-o1所展現(xiàn)的自發(fā)性推理能力，正是自發(fā)性人工智能（Spontaneous AI）研究的核心目標(biāo)之一。這一領(lǐng)域的研究旨在通過(guò)機(jī)器學(xué)習(xí)和復(fù)雜時(shí)間模式的設(shè)計(jì)，賦予機(jī)器人或智能系統(tǒng)以類似動(dòng)物的自發(fā)行為能力。LLaVA-o1的成功研發(fā)，無(wú)疑為自發(fā)性人工智能的研究注入了新的活力和動(dòng)力。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

騰訊AI重將劉威離職，混元大模型技術(shù)未來(lái)何去何從？

11-19

絕味食品牽手騰訊智慧零售，共探“AI+餐飲連鎖”數(shù)智增長(zhǎng)新路徑

11-19

北大清華等聯(lián)手發(fā)布LLaVA-o1，開(kāi)啟自發(fā)性視覺(jué)AI新紀(jì)元

11-19

祥源文旅攜手共創(chuàng)新企業(yè)，上海通航航空發(fā)展公司正式成立

11-19

AI重點(diǎn)通知來(lái)襲，誰(shuí)將主宰AI OS新戰(zhàn)場(chǎng)？

11-19

鴻佰科技亮相SC24，展出AI高速計(jì)算數(shù)據(jù)中心創(chuàng)新成果引關(guān)注

11-19

出門(mén)問(wèn)問(wèn)榮獲“優(yōu)秀上市公司”，AI創(chuàng)新引領(lǐng)未來(lái)高質(zhì)量發(fā)展

11-19

OpenAI新o1模型欺騙性引熱議，專家：加強(qiáng)監(jiān)管，守護(hù)AI安全底線

11-19

任度雙腦大模型：數(shù)推分離，重塑AI技術(shù)新篇章

11-19

攜程Q3財(cái)報(bào)亮點(diǎn)：營(yíng)收凈利雙增長(zhǎng)，國(guó)際業(yè)務(wù)復(fù)蘇強(qiáng)勁

11-19

榮耀AI換臉檢測(cè)功能將普及，趙明：加快升級(jí)更多機(jī)型

11-19

東風(fēng)日產(chǎn)N7廣州車展驚艷登場(chǎng)，中大型純電轎車新標(biāo)桿？

11-19

英偉達(dá)攜手谷歌，加速量子計(jì)算處理器設(shè)計(jì)進(jìn)程

11-19

金川集團(tuán)新能源礦卡領(lǐng)航智能礦業(yè)，喜獲高交會(huì)科研成果創(chuàng)新大獎(jiǎng)

11-19

微軟東京新設(shè)研發(fā)中心，聚焦機(jī)器人+AI技術(shù)

11-19

點(diǎn)擊查看更多 +

全站最新

華為Mate 70系列到店預(yù)訂火爆，Mate品牌盛典即將開(kāi)啟新篇章！

鋰礦巨頭坦言：西方想搶中國(guó)鋰礦控制權(quán)？經(jīng)濟(jì)上不劃算！

喬思伯C6 MAX機(jī)箱上新：內(nèi)嵌玻璃側(cè)透，魔術(shù)粘扣提手便攜設(shè)計(jì)

華為WATCH D2預(yù)售：2888元起，24小時(shí)動(dòng)態(tài)血壓監(jiān)測(cè)新體驗(yàn)！

三星ALoP技術(shù)革新潛望長(zhǎng)焦，超薄手機(jī)鏡頭模組指日可待？

蘋(píng)果iCloud備份“斷舍離”，iOS 8及以下設(shè)備何去何從？

熱門(mén)內(nèi)容

本欄最新

北大清華等聯(lián)合發(fā)布LLaVA-o1：革新視覺(jué)AI，引領(lǐng)推理計(jì)算新風(fēng)尚

騰訊AI重將劉威離職，混元大模型技術(shù)未來(lái)何去何從？

絕味食品牽手騰訊智慧零售，共探“AI+餐飲連鎖”數(shù)智增長(zhǎng)新路徑

北大清華等聯(lián)手發(fā)布LLaVA-o1，開(kāi)啟自發(fā)性視覺(jué)AI新紀(jì)元

AI重點(diǎn)通知來(lái)襲，誰(shuí)將主宰AI OS新戰(zhàn)場(chǎng)？

鴻佰科技亮相SC24，展出AI高速計(jì)算數(shù)據(jù)中心創(chuàng)新成果引關(guān)注

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

北大清華等聯(lián)合發(fā)布LLaVA-o1：革新視覺(jué)AI，引領(lǐng)推理計(jì)算新風(fēng)尚

北大清華等聯(lián)合發(fā)布LLaVA-o1：革新視覺(jué)AI，引領(lǐng)推理計(jì)算新風(fēng)尚