在科技日新月異的今天,人工智能(AI)的應(yīng)用領(lǐng)域不斷拓寬,從文學(xué)創(chuàng)作到藝術(shù)創(chuàng)作,再到日常交流,AI的身影無處不在。然而,AI的潛力遠(yuǎn)不止于此,它還能在更多意想不到的領(lǐng)域中發(fā)揮作用,比如預(yù)警危險(xiǎn)、豐富課堂教學(xué),甚至用方言演繹古典詩詞。
在近期中央廣播電視總臺(tái)舉辦的首屆《中國(guó)科技創(chuàng)新盛典》上,科大訊飛董事長(zhǎng)劉慶峰通過一系列生動(dòng)的現(xiàn)場(chǎng)演示,向全國(guó)觀眾展示了AI技術(shù)如何賦能各行各業(yè),以及它如何深入百姓生活,服務(wù)于社會(huì)發(fā)展。
作為總臺(tái)繼“春晚”之后的又一力作,此次盛典以“新質(zhì)生產(chǎn)力”為主題,全面展示了2024年中國(guó)在科技創(chuàng)新方面的重大成果??拼笥嶏w作為人工智能領(lǐng)域的代表企業(yè),在盛典現(xiàn)場(chǎng)展示了其最新的AI技術(shù)應(yīng)用。
在盛典的高潮部分,舞臺(tái)上出現(xiàn)了一個(gè)令人驚嘆的身影——“AI張騰岳”。這個(gè)由科大訊飛訊飛智作打造的虛擬數(shù)字人,不僅與真人主持人張騰岳互動(dòng)自如,更用陜西、粵語、河南三種方言分別朗誦了《靜夜思》、《望月懷遠(yuǎn)》和《滿江紅》等經(jīng)典詩詞。其字正腔圓、韻味十足的表演,贏得了現(xiàn)場(chǎng)觀眾的陣陣掌聲。
據(jù)了解,“AI張騰岳”融合了科大訊飛的語音合成、語音識(shí)別、語義理解、唇形預(yù)測(cè)、圖像處理等先進(jìn)技術(shù)。通過深度學(xué)習(xí),它能夠精準(zhǔn)還原人類的表情和動(dòng)作,配合先進(jìn)的語音合成技術(shù),使得AI張騰岳具備了自然的表情、流暢的動(dòng)作和真實(shí)的聲音。
在今年的科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛發(fā)布了超擬人數(shù)字人技術(shù)。這項(xiàng)技術(shù)僅需一張照片,就能生成專屬的虛擬數(shù)字人形象,其口型、表情、動(dòng)作均由大模型自動(dòng)生成,能夠精準(zhǔn)匹配文本的意圖。這一技術(shù)的發(fā)布,進(jìn)一步降低了虛擬數(shù)字人的應(yīng)用門檻。
目前,訊飛智作的視頻配音、新聞視頻、培訓(xùn)視頻、廣告視頻等應(yīng)用已經(jīng)廣泛應(yīng)用于媒體、金融、智慧文旅、企業(yè)數(shù)字化、智慧政務(wù)、IP運(yùn)營(yíng)等多個(gè)領(lǐng)域。同時(shí),訊飛智作還與學(xué)習(xí)強(qiáng)國(guó)、新華社、WAIC、中信銀行、中國(guó)平安等單位建立了合作關(guān)系。
虛擬數(shù)字人的應(yīng)用不僅限于此,它們正在解鎖越來越多的行業(yè)應(yīng)用場(chǎng)景。從國(guó)際賽事如巴黎奧運(yùn)會(huì),到非遺文化如北京中軸線,再到行業(yè)活動(dòng)如天津智博會(huì),以及智慧展廳如山東高速,虛擬數(shù)字人都在發(fā)揮著越來越重要的作用。它們不僅能夠進(jìn)行產(chǎn)品介紹和客戶服務(wù),還能基于大數(shù)據(jù)和AI技術(shù)提供更加精準(zhǔn)、個(gè)性化的服務(wù)體驗(yàn)。
訊飛多場(chǎng)景虛擬數(shù)字人結(jié)合大模型的應(yīng)用,也在央國(guó)企、教育培訓(xùn)、文化旅游、電子商務(wù)、金融服務(wù)等多個(gè)行業(yè)領(lǐng)域內(nèi)成功落地。這些應(yīng)用不僅展現(xiàn)了AI技術(shù)的強(qiáng)大實(shí)力,也體現(xiàn)了科大訊飛在推動(dòng)人工智能產(chǎn)業(yè)發(fā)展方面的貢獻(xiàn)。
作為新質(zhì)生產(chǎn)力的代表,虛擬人平臺(tái)始終踐行“人工智能+”的理念,致力于讓虛擬人成為人類的伙伴。未來,隨著AI技術(shù)的不斷發(fā)展,虛擬數(shù)字人將在更多領(lǐng)域發(fā)揮更大的作用,為人類生活帶來更多便利和驚喜。