隨著人工智能技術(shù)的飛速發(fā)展,深度推理模型已成為當(dāng)下科技領(lǐng)域的熱門(mén)話(huà)題。近期,國(guó)內(nèi)外多家企業(yè)紛紛發(fā)布“類(lèi)OpenAI o1”的推理模型,其中,科大訊飛作為國(guó)內(nèi)AI領(lǐng)域的佼佼者,也推出了其訊飛星火深度推理模型X1,標(biāo)志著中國(guó)在深度推理模型領(lǐng)域的又一重要突破。
自去年年底OpenAI發(fā)布o(jì)3模型以來(lái),推理能力的大幅提升為業(yè)界帶來(lái)了新的希望,也推動(dòng)了這一領(lǐng)域的快速發(fā)展。英偉達(dá)CEO黃仁勛在最近的CES演講中也提到,除了傳統(tǒng)的大算力、大數(shù)據(jù)、大模型路徑外,后訓(xùn)練和推理能力的提升也是增強(qiáng)模型性能的重要途徑。
科大訊飛此次發(fā)布的星火X1,依托其在行業(yè)、企業(yè)落地方面的深厚積累,成為國(guó)內(nèi)首個(gè)采用全國(guó)產(chǎn)算力平臺(tái),并率先落地到真實(shí)應(yīng)用場(chǎng)景的深度推理模型。這一模型在教育、醫(yī)療等領(lǐng)域展現(xiàn)出顯著優(yōu)勢(shì),特別是在數(shù)學(xué)問(wèn)題上,星火X1的表現(xiàn)尤為突出。
在數(shù)學(xué)這一大模型繞不過(guò)去的難題上,星火X1展現(xiàn)出了強(qiáng)大的推理能力。面對(duì)高中競(jìng)賽級(jí)別的數(shù)學(xué)題,星火X1不僅能準(zhǔn)確解答,還能通過(guò)思維鏈等方式將復(fù)雜問(wèn)題分步拆解簡(jiǎn)化,在生成回答的過(guò)程中進(jìn)行反思、驗(yàn)證。這種深度推理能力使得星火X1在解答困難數(shù)學(xué)問(wèn)題時(shí),能夠以較高的正確率完成從理解題目到解題再到驗(yàn)證的全流程。
科大訊飛在智慧教育領(lǐng)域的布局已有20余年,目前已有超過(guò)5萬(wàn)所學(xué)校常態(tài)化使用訊飛智慧教育產(chǎn)品。星火X1的推出,無(wú)疑將為訊飛旗下的數(shù)學(xué)類(lèi)產(chǎn)品帶來(lái)更強(qiáng)大的能力。據(jù)悉,星火X1已參加了從小高初數(shù)學(xué)(含競(jìng)賽)到AIME邀請(qǐng)賽等覆蓋全學(xué)段的多項(xiàng)考試,得分水平處于業(yè)界第一梯隊(duì),其中多項(xiàng)指標(biāo)國(guó)內(nèi)第一。
除了在數(shù)學(xué)領(lǐng)域的優(yōu)勢(shì)外,科大訊飛還致力于將星火X1應(yīng)用于更多行業(yè)場(chǎng)景。過(guò)去一年,科大訊飛與央國(guó)企及20多個(gè)行業(yè)的頭部企業(yè)一起發(fā)布行業(yè)大模型,覆蓋通信、金融、能源、教育、政務(wù)、醫(yī)療等300多個(gè)應(yīng)用場(chǎng)景。這一布局使得訊飛能夠快速將模型大技術(shù)落地到具體行業(yè)場(chǎng)景中,推動(dòng)智能化轉(zhuǎn)型。
然而,國(guó)內(nèi)大模型在行業(yè)應(yīng)用中的落地也面臨著一些挑戰(zhàn)。其中,算力供應(yīng)是一個(gè)重要問(wèn)題。長(zhǎng)期以來(lái),國(guó)內(nèi)企業(yè)在高端算力供應(yīng)上依賴(lài)進(jìn)口,尤其是英偉達(dá)等國(guó)際巨頭的GPU產(chǎn)品。隨著近期美國(guó)對(duì)高端算力出口的限制,國(guó)內(nèi)許多AI企業(yè)的研發(fā)和商業(yè)化落地都面臨巨大挑戰(zhàn)。因此,國(guó)產(chǎn)算力的自主化顯得尤為重要。
訊飛此次發(fā)布的星火X1,正是國(guó)內(nèi)首個(gè)完全依托全國(guó)產(chǎn)算力平臺(tái)的深度推理大模型。其背后的“飛星一號(hào)”是全國(guó)首個(gè)全國(guó)產(chǎn)萬(wàn)卡算力集群,具備常態(tài)化支持萬(wàn)億參數(shù)大模型訓(xùn)練的能力。這一算力平臺(tái)由科大訊飛與華為聯(lián)合研發(fā),實(shí)現(xiàn)了軟硬件的全棧國(guó)產(chǎn)化,標(biāo)志著國(guó)產(chǎn)算力在性能上邁出了重要一步。
針對(duì)國(guó)產(chǎn)算力生態(tài)方面的短板,訊飛與華為攜手推進(jìn)國(guó)產(chǎn)化算子的開(kāi)發(fā)與優(yōu)化。目前,雙方已識(shí)別并聯(lián)合研發(fā)了超過(guò)100個(gè)大模型專(zhuān)用訓(xùn)練/推理算子,其中50多個(gè)算子已完成深度優(yōu)化。訊飛還構(gòu)建了自動(dòng)化故障處理體系,顯著提升了算力平臺(tái)的穩(wěn)定性和可靠性。
科大訊飛在深度推理模型領(lǐng)域的探索,不僅展現(xiàn)了其在AI技術(shù)上的實(shí)力,也為中國(guó)AI產(chǎn)業(yè)的發(fā)展注入了新的活力。隨著星火X1在更多行業(yè)場(chǎng)景的應(yīng)用落地,我們有理由相信,科大訊飛將逐漸探索出一條深度推理模型的中國(guó)道路。