ITBear旗下自媒體矩陣:

科大訊飛發(fā)布星火語音同傳大模型,5秒內(nèi)實現(xiàn)人類專家級同傳水平!

   時間:2025-01-15 15:40:31 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

科大訊飛近日宣布了一項重大技術(shù)突破,正式推出了名為“星火”的國內(nèi)首款端到端語音同傳大模型。這一創(chuàng)新成果標志著我國在語音識別與翻譯領(lǐng)域邁出了重要一步。

據(jù)科大訊飛官方介紹,“星火”語音同傳大模型專為解決日常對話、商務(wù)交流及行業(yè)翻譯等國際交流場景中的高難度同傳翻譯問題而設(shè)計。其性能在內(nèi)容完整性、信息準確性以及語言流暢度上均達到了行業(yè)頂尖水平,甚至超越了國際知名企業(yè)的同類產(chǎn)品,如谷歌的Gemini 2.0和OpenAI的GPT-4(原文GPT-4o疑為筆誤,此處已更正)。在實際應(yīng)用中,“星火”模型能夠?qū)崿F(xiàn)5秒以內(nèi)的同傳時延,這一速度已接近人類專業(yè)譯員的水平。

為了直觀展示“星火”模型的強大功能,科大訊飛還進行了現(xiàn)場演示。通過翻譯機進行語音同聲傳譯,即便是專有詞匯也能被準確翻譯,展現(xiàn)了模型在復(fù)雜語境下的處理能力。

“星火”語音同傳大模型還具備記錄回溯對話內(nèi)容的功能,用戶可以隨時查看之前的翻譯記錄。同時,該模型還支持連接耳機、音箱等音頻設(shè)備,為不同場景下的使用提供了極大的便利。

在技術(shù)層面,“星火”語音同傳大模型支持譯文長度的反向調(diào)控,能夠根據(jù)用戶需求調(diào)整翻譯結(jié)果的長度。同時,其語音到文本的端到端翻譯功能支持流式意群切分、語境理解及信息重組,確保了翻譯的準確性和流暢性。而流式語音合成功能則支持意群韻律銜接和自適應(yīng)語速調(diào)節(jié),使翻譯結(jié)果更加自然、易于理解。

科大訊飛表示,未來將繼續(xù)深耕語音識別與翻譯領(lǐng)域,計劃在2025年推出更多翻譯機新品,以滿足不同用戶的需求。隨著“星火”語音同傳大模型的推出,科大訊飛在語音識別與翻譯領(lǐng)域的領(lǐng)先地位將進一步鞏固。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version