【ITBEAR】國產(chǎn)視頻大模型廠商Vidu近日宣布,其全新版本Vidu 1.5已正式上線。該版本在技術(shù)上取得了重大突破,被譽(yù)為達(dá)到“世界領(lǐng)先水平”,尤其在處理多樣化輸入及解決“一致性”難題上表現(xiàn)卓越。
Vidu自上線以來,便以其出色的角色一致性生成能力受到關(guān)注。通過精準(zhǔn)鎖定人物面部特征,Vidu成功解決了視頻生成中的關(guān)鍵痛點,確保了人物形象的連貫性。而在Vidu 1.5中,廠商進(jìn)一步展現(xiàn)了其上下文學(xué)習(xí)能力,顯著提升了視頻模型的可控性。
新版本在三個方面顯著展示了技術(shù)上的革新與突破。首先,對于復(fù)雜主體,如細(xì)節(jié)豐富的角色或復(fù)雜物體,Vidu 1.5能夠在多個視角下保持高度的一致性。例如,在處理3D動畫風(fēng)格角色時,無論視角如何變換,其頭型、服飾等細(xì)節(jié)始終如一,有效避免了傳統(tǒng)模型在視角切換時可能出現(xiàn)的問題。
其次,在人物特寫鏡頭中,Vidu 1.5自然且流暢地維持了人物面部特征和動態(tài)表情的連貫性。這有效消除了面部僵硬或失真的現(xiàn)象,使得生成的視頻更加自然真實。
最后,Vidu 1.5還實現(xiàn)了多主體一致性。用戶現(xiàn)在可以上傳包括人物角色、道具物體、環(huán)境背景等多個主題圖像,并在視頻生成過程中實現(xiàn)這些元素的交互。這一功能為用戶提供了更高的自定義空間,能夠創(chuàng)造出更為豐富和個性化的視頻內(nèi)容。
Vidu 1.5的發(fā)布無疑標(biāo)志著國產(chǎn)視頻大模型技術(shù)邁上了新的臺階,其在處理復(fù)雜視頻生成任務(wù)時展現(xiàn)出的卓越性能和高度可控性,必將為用戶帶來更加出色的使用體驗。