【ITBEAR】在近日落幕的2024國際多媒體會議(ACM MM 2024)上,中國人民大學(xué)高瓴人工智能學(xué)院與值得買科技聯(lián)合研究團隊展露鋒芒。團隊代表王希華發(fā)表了關(guān)于多模態(tài)領(lǐng)域最新研究成果《TiVA:時序同步的視頻到音頻生成》的口頭報告,揭示了解決視頻到音頻同步生成技術(shù)難題的新路徑。
TiVA框架通過創(chuàng)新的音頻布局使用,不僅提升了AIGC內(nèi)容生成的速度與質(zhì)量,更在語義匹配和時間同步精度上實現(xiàn)了突破,獲得國家發(fā)明專利授權(quán),成為多媒體領(lǐng)域的一大亮點。
該研究團隊還展示了另外兩項成果:面向電商領(lǐng)域的共享基座檢索增強架構(gòu)(BSharedRAG)與多模態(tài)知識增強的視覺信息查詢架構(gòu)(MuKA)。其中,BSharedRAG架構(gòu)已被國際頂尖會議EMNLP2024錄用,彰顯了其在自然語言處理與人工智能領(lǐng)域的領(lǐng)先地位。
值得買科技CTO王云峰表示,這些研究成果不僅推動了公司業(yè)務(wù)的提質(zhì)增效,更為整個電商行業(yè)的智能化升級貢獻了力量。通過與人大高瓴的深入合作,值得買科技正逐步構(gòu)建起強大的AI技術(shù)壁壘,并致力于將科技成果與行業(yè)經(jīng)驗開放共享,推動行業(yè)的持續(xù)繁榮。
BSharedRAG架構(gòu)的開源評測集更是為行業(yè)提供了一個統(tǒng)一的基準,助力研究者在不同研究工作之間進行效果對比,推動了電商領(lǐng)域AI技術(shù)的標準化與透明化發(fā)展。
隨著全面AI戰(zhàn)略的深入實施,值得買科技將繼續(xù)攜手合作伙伴,在產(chǎn)學(xué)研用一體化進程中不斷探索AI技術(shù)的更多可能性,為消費者帶來更加智能、高效的購物體驗。