滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

訊飛發(fā)布新交互大模型：數(shù)字人語音視覺三合一，智能體驗(yàn)再升級(jí)！

時(shí)間：2024-11-14 19:17:27 來源：ITBEAR作者：IT之家編輯：瑞雪 發(fā)表評(píng)論無障礙通道

【ITBEAR】訊飛開放平臺(tái)今日宣布重大進(jìn)展，其全新研發(fā)的訊飛星火多模態(tài)交互大模型已正式上線。這一技術(shù)突破實(shí)現(xiàn)了從單一的語音交互到音視頻流實(shí)時(shí)多模態(tài)交互的跨越，為用戶帶來更為豐富和自然的交互體驗(yàn)。

訊飛星火多模態(tài)交互大模型首次引入了超擬人數(shù)字人技術(shù)，該技術(shù)使得數(shù)字人的軀干和四肢動(dòng)作能夠與語音內(nèi)容精準(zhǔn)匹配，快速生成相應(yīng)的表情和動(dòng)作，從而讓AI形象更加栩栩如生。通過統(tǒng)一文本、語音和表情的表達(dá)，該模型在跨模態(tài)的語義一致性上取得了顯著成效，使得大模型的情感表達(dá)更為真實(shí)和連貫。

在交互速度方面，該模型同樣表現(xiàn)出色。它采用了統(tǒng)一的神經(jīng)網(wǎng)絡(luò)，直接實(shí)現(xiàn)了語音到語音的端到端建模，從而大大提升了響應(yīng)速度和流暢性。該模型還能夠敏銳地感知用戶的情緒變化，并根據(jù)指令自由調(diào)整聲音的節(jié)奏、大小和人設(shè)，為用戶提供更加個(gè)性化的交互體驗(yàn)。

訊飛星火多模態(tài)交互大模型還支持多模態(tài)視覺交互。它不僅能夠“聽懂世界”，更能“認(rèn)清萬物”，通過全面感知具體的背景場(chǎng)景、物流狀態(tài)等信息，對(duì)任務(wù)的理解更加精準(zhǔn)。同時(shí)，該模型還能夠綜合判斷語音、手勢(shì)、行為和情緒等多種信息，作出更為合適的響應(yīng)。

據(jù)此前報(bào)道，用戶已經(jīng)可以與數(shù)字人進(jìn)行自然的語音和視頻通話。在通話過程中，數(shù)字人不僅能夠?qū)崿F(xiàn)與用戶的自然語音對(duì)話，其人物表情等也能夠與說話語句相匹配。星火超擬人數(shù)字人還支持多模態(tài)交互功能，這使得數(shù)字人能夠識(shí)別攝像頭中的內(nèi)容，如識(shí)別孫悟空和奧特曼站在一起、識(shí)別面霜的品牌和作用以及花的品類等。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

生成式AI是否面臨發(fā)展瓶頸？OpenAI CEO阿爾特曼回應(yīng)引發(fā)熱議

11-14

新大腦科技引領(lǐng)智慧停車革新：無線視頻樁，全球車牌一網(wǎng)打盡！

11-14

復(fù)合型AI崛起：中國企業(yè)智能化改革的新動(dòng)力

11-14

中國土木全球財(cái)務(wù)共享實(shí)踐，助力企業(yè)國際化經(jīng)營管控新篇章

11-14

騰訊三季度財(cái)報(bào)出爐：日賺6.5億，游戲收入達(dá)518億，員工年薪平均108萬！

11-14

蘋果進(jìn)軍智能家居市場(chǎng)，行業(yè)迎來新變革！企查查數(shù)據(jù)顯示：超六成老牌企業(yè)已布局

11-14

騰訊布局AI領(lǐng)域新動(dòng)作：積極申請(qǐng)“騰訊AI助手”商標(biāo)

11-14

猿編程李翊：AI時(shí)代，編程教育如何助力孩子培養(yǎng)計(jì)算思維與未來視野？

11-14

福布斯發(fā)布2024中國創(chuàng)新榜單：百利天恒、恒瑞、劑泰、康方生物等藥企榮耀上榜！

11-14

國產(chǎn)大模型Vidu再升級(jí)，實(shí)現(xiàn)多角度一致性，視頻生成更自然！

11-14

2025款別克世紀(jì)重磅來襲！4/6/7座多樣選擇，尊貴體驗(yàn)再升級(jí)！

11-14

字節(jié)豆包推出SeedEdit：AI修圖新時(shí)代，你準(zhǔn)備好迎接變革了嗎？

11-14

MiniMax海螺AI風(fēng)靡海外，月訪問破千萬助力視頻生成新紀(jì)元

11-14

英偉達(dá)瞄準(zhǔn)人形機(jī)器人市場(chǎng)，2025年將推出新款Jetson Thor計(jì)算機(jī)

11-14

ASML預(yù)測(cè)：人工智能推動(dòng)未來五年銷售增長，2030年收入有望達(dá)到440億至600億歐元

11-14

點(diǎn)擊查看更多 +

全站最新

哪吒汽車重大戰(zhàn)略調(diào)整：聚焦核心業(yè)務(wù)，力爭(zhēng)明年2月現(xiàn)金流轉(zhuǎn)正！

B站2024年第三季度財(cái)報(bào)亮眼：首次單季盈利，社區(qū)生態(tài)與商業(yè)收入雙增長

吉利控股大動(dòng)作：極氪與領(lǐng)克合并，新能源市場(chǎng)將迎來新變局！

雷軍將攜小米SU7 Prototype亮相廣州車展，全球最速四門車或成焦點(diǎn)！

ST股掀漲停風(fēng)暴，A股三大指數(shù)早盤集體收跌，4000多股下挫

創(chuàng)業(yè)板指大跌3%以上，全市場(chǎng)低迷，唯ST板塊逆勢(shì)走強(qiáng)

熱門內(nèi)容

本欄最新

新大腦科技引領(lǐng)智慧停車革新：無線視頻樁，全球車牌一網(wǎng)打盡！

復(fù)合型AI崛起：中國企業(yè)智能化改革的新動(dòng)力

中國土木全球財(cái)務(wù)共享實(shí)踐，助力企業(yè)國際化經(jīng)營管控新篇章

騰訊三季度財(cái)報(bào)出爐：日賺6.5億，游戲收入達(dá)518億，員工年薪平均108萬！

猿編程李翊：AI時(shí)代，編程教育如何助力孩子培養(yǎng)計(jì)算思維與未來視野？

福布斯發(fā)布2024中國創(chuàng)新榜單：百利天恒、恒瑞、劑泰、康方生物等藥企榮耀上榜！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

訊飛發(fā)布新交互大模型：數(shù)字人語音視覺三合一，智能體驗(yàn)再升級(jí)！

訊飛發(fā)布新交互大模型：數(shù)字人語音視覺三合一，智能體驗(yàn)再升級(jí)！