【ITBEAR】微軟近日獲得一項(xiàng)新專利,該專利構(gòu)想了一種利用人工智能模型Copilot來為用戶創(chuàng)作與視頻、文本及PowerPoint等內(nèi)容相匹配的音樂或背景音樂的方法。這一創(chuàng)新技術(shù)被命名為《Artificial intelligence model for composing audio scores》,它探討了如何根據(jù)輸入的內(nèi)容來生成音樂。
專利文檔中詳細(xì)描述了技術(shù)的實(shí)現(xiàn)步驟:首先,系統(tǒng)會(huì)收集包含視頻和音頻的大量訓(xùn)練數(shù)據(jù);接著,通過分析這些數(shù)據(jù)集,提取出如顏色、形狀、運(yùn)動(dòng)及場(chǎng)景等不同類型的特征;最后,Copilot將尋找這些特征之間的關(guān)聯(lián)性,例如特定場(chǎng)景通常伴隨的音樂類型,從而生成與新的視頻或文本內(nèi)容相匹配的音頻。
這項(xiàng)技術(shù)可廣泛應(yīng)用于多個(gè)領(lǐng)域,如電影、電視節(jié)目的背景音樂自動(dòng)生成,為商業(yè)廣告創(chuàng)作契合氛圍的音樂,游戲中動(dòng)態(tài)配樂的制作,以及通過音頻增強(qiáng)虛擬現(xiàn)實(shí)中的沉浸式體驗(yàn)等。在日常生活中,它也能為特定場(chǎng)合如求婚等自動(dòng)匹配合適的音樂,增添氛圍。