滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

國產(chǎn)大模型Vidu再升級，實現(xiàn)多角度一致性，視頻生成更自然！

時間：2024-11-14 17:10:34 來源：ITBEAR作者：IT之家編輯：瑞雪 發(fā)表評論無障礙通道

【ITBEAR】國產(chǎn)視頻大模型廠商Vidu近日宣布，其全新版本Vidu 1.5已正式上線。該版本在技術(shù)上取得了重大突破，被譽(yù)為達(dá)到“世界領(lǐng)先水平”，尤其在處理多樣化輸入及解決“一致性”難題上表現(xiàn)卓越。

Vidu自上線以來，便以其出色的角色一致性生成能力受到關(guān)注。通過精準(zhǔn)鎖定人物面部特征，Vidu成功解決了視頻生成中的關(guān)鍵痛點，確保了人物形象的連貫性。而在Vidu 1.5中，廠商進(jìn)一步展現(xiàn)了其上下文學(xué)習(xí)能力，顯著提升了視頻模型的可控性。

新版本在三個方面顯著展示了技術(shù)上的革新與突破。首先，對于復(fù)雜主體，如細(xì)節(jié)豐富的角色或復(fù)雜物體，Vidu 1.5能夠在多個視角下保持高度的一致性。例如，在處理3D動畫風(fēng)格角色時，無論視角如何變換，其頭型、服飾等細(xì)節(jié)始終如一，有效避免了傳統(tǒng)模型在視角切換時可能出現(xiàn)的問題。

其次，在人物特寫鏡頭中，Vidu 1.5自然且流暢地維持了人物面部特征和動態(tài)表情的連貫性。這有效消除了面部僵硬或失真的現(xiàn)象，使得生成的視頻更加自然真實。

最后，Vidu 1.5還實現(xiàn)了多主體一致性。用戶現(xiàn)在可以上傳包括人物角色、道具物體、環(huán)境背景等多個主題圖像，并在視頻生成過程中實現(xiàn)這些元素的交互。這一功能為用戶提供了更高的自定義空間，能夠創(chuàng)造出更為豐富和個性化的視頻內(nèi)容。

Vidu 1.5的發(fā)布無疑標(biāo)志著國產(chǎn)視頻大模型技術(shù)邁上了新的臺階，其在處理復(fù)雜視頻生成任務(wù)時展現(xiàn)出的卓越性能和高度可控性，必將為用戶帶來更加出色的使用體驗。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

2025款別克世紀(jì)重磅來襲！4/6/7座多樣選擇，尊貴體驗再升級！

11-14

字節(jié)豆包推出SeedEdit：AI修圖新時代，你準(zhǔn)備好迎接變革了嗎？

11-14

MiniMax海螺AI風(fēng)靡海外，月訪問破千萬助力視頻生成新紀(jì)元

11-14

英偉達(dá)瞄準(zhǔn)人形機(jī)器人市場，2025年將推出新款Jetson Thor計算機(jī)

11-14

ASML預(yù)測：人工智能推動未來五年銷售增長，2030年收入有望達(dá)到440億至600億歐元

11-14

智界R7勢頭強(qiáng)勁！交付破萬大定超3.8萬臺，電動SUV市場迎新黑馬？

11-14

2025款別克世紀(jì)全面升級，4/6/7座多樣選擇，尊貴體驗正式開啟！

11-14

騰訊云攜手零售領(lǐng)袖，共探AI智能化轉(zhuǎn)型新路徑

11-14

聲網(wǎng)首席科學(xué)家鐘聲：分布式端邊云結(jié)合，實時AI基礎(chǔ)設(shè)施新趨勢！

11-14

僑銀股份與阿聯(lián)酋攜手，創(chuàng)新城市服務(wù)驅(qū)動環(huán)境可持續(xù)發(fā)展新篇章

11-14

猿編程李翊探路AI時代：如何培育引領(lǐng)未來的科技少年？

11-14

紅旗天工08廣州車展搶先看：中大型SUV新力軍，內(nèi)外設(shè)計盡顯國粹之美！

11-14

紅旗天工08廣州車展搶先看：中大型SUV新力量，內(nèi)外設(shè)計盡顯融合之美！

11-14

努比亞Z70 Ultra定檔11月21日：無孔全面屏與AI黑科技，挑戰(zhàn)iPhone霸主地位？

11-14

國產(chǎn)手機(jī)邁向高端市場：均價逼近4000元，你準(zhǔn)備好了嗎？

11-14

點擊查看更多 +

全站最新

央行新動向：即將在香港發(fā)行兩期央票，總額高達(dá)450億元人民幣！

廣州農(nóng)商銀行籌劃百億資產(chǎn)轉(zhuǎn)讓，預(yù)計稅前將虧損3.4億

廣州農(nóng)商銀行籌劃百億資產(chǎn)轉(zhuǎn)讓，預(yù)計稅前虧損達(dá)3.4億

首旅如家酒店集團(tuán)：以心價比引領(lǐng)投資新潮流，打造文旅行業(yè)新范本！

中信金融巨資布局：溢價購入中行、光大行股份，看好中信股份估值修復(fù)空間

珍酒李渡穩(wěn)健前行，以戰(zhàn)略眼光引領(lǐng)行業(yè)，頻獲資本市場認(rèn)可

熱門內(nèi)容

本欄最新

字節(jié)豆包推出SeedEdit：AI修圖新時代，你準(zhǔn)備好迎接變革了嗎？

MiniMax海螺AI風(fēng)靡海外，月訪問破千萬助力視頻生成新紀(jì)元

英偉達(dá)瞄準(zhǔn)人形機(jī)器人市場，2025年將推出新款Jetson Thor計算機(jī)

ASML預(yù)測：人工智能推動未來五年銷售增長，2030年收入有望達(dá)到440億至600億歐元

騰訊云攜手零售領(lǐng)袖，共探AI智能化轉(zhuǎn)型新路徑

聲網(wǎng)首席科學(xué)家鐘聲：分布式端邊云結(jié)合，實時AI基礎(chǔ)設(shè)施新趨勢！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

國產(chǎn)大模型Vidu再升級，實現(xiàn)多角度一致性，視頻生成更自然！

國產(chǎn)大模型Vidu再升級，實現(xiàn)多角度一致性，視頻生成更自然！