【ITBEAR】字節(jié)跳動(dòng)推出新一代單圖視頻驅(qū)動(dòng)技術(shù)——X-Portrait 2,該技術(shù)僅需一張靜態(tài)圖片和一段驅(qū)動(dòng)視頻,便能生成高品質(zhì)、“電影級(jí)”的視頻內(nèi)容。
X-Portrait 2技術(shù)的亮點(diǎn)在于,它不僅完美保留了原圖的身份特征(ID),同時(shí)能夠精準(zhǔn)捕捉并遷移各種細(xì)致入微乃至夸張的表情和情緒。這一創(chuàng)新極大地簡化了動(dòng)作捕捉、角色動(dòng)畫以及內(nèi)容創(chuàng)作的流程。
與以往依賴人臉關(guān)鍵點(diǎn)檢測的技術(shù)不同,X-Portrait 2通過構(gòu)建一個(gè)先進(jìn)的表情編碼器模型,并采用端到端的自監(jiān)督訓(xùn)練框架,從海量的人像視頻中自我學(xué)習(xí),提取出與身份無關(guān)的運(yùn)動(dòng)隱式表征。
該技術(shù)進(jìn)一步融合了強(qiáng)大的生成式擴(kuò)散模型,從而能夠生成出流暢且極具表現(xiàn)力的視頻。在經(jīng)過大規(guī)模高質(zhì)量表情視頻的訓(xùn)練后,X-Portrait 2在運(yùn)動(dòng)表現(xiàn)力和身份保持性上均顯著超越了之前的技術(shù)。
業(yè)界專家表示,X-Portrait 2的推出將極大地推動(dòng)視頻創(chuàng)作領(lǐng)域的進(jìn)步,為創(chuàng)作者們提供更為便捷高效的工具,同時(shí)也將為用戶帶來更加豐富多樣的視覺體驗(yàn)。
感興趣的用戶和開發(fā)者可以通過訪問項(xiàng)目地址:https://byteaigc.github.io/X-Portrait2/,了解更多關(guān)于X-Portrait 2的詳細(xì)信息,并體驗(yàn)其強(qiáng)大的功能。