在人工智能領域,一場悄無聲息的革命正在中國上演。距離國產(chǎn)大模型在考研數(shù)學題上取得突破性進展僅僅兩個月后,月之暗面團隊在春節(jié)前夕再度投擲了一枚震撼業(yè)界的“重磅炸彈”——他們推出了能夠媲美OpenAI滿血版o1(正式版而非預覽版)的K1.5多模態(tài)模型,這一模型在文字和視覺兩大領域均實現(xiàn)了對國際先進水平的超越。
Kimi模型一經(jīng)發(fā)布,便迅速引發(fā)了全球范圍內(nèi)的廣泛關注。從日本到美國,再到資源豐富的阿拉伯國家,網(wǎng)友們無不對Kimi模型在推理能力和多模態(tài)技術上的顯著進步表示驚嘆。這些正面的反饋無疑是對中國AI事業(yè)發(fā)展的巨大鼓舞。
從發(fā)布時間上來看,雖然DeepSeek-R1的發(fā)布略早于K1.5,但在模態(tài)多樣性方面,K1.5無疑是OpenAI之外,唯一一個實現(xiàn)了o1正式版多模態(tài)推理的大模型。其重要性不言而喻。
在性能測試方面,Kimi k1.5的表現(xiàn)同樣令人矚目。在short-CoT模式下,K1.5已經(jīng)大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領先幅度高達550%。而在long-CoT模式下,Kimi k1.5在數(shù)學、代碼、多模態(tài)推理能力等方面,也毫不遜色于目前處于第一梯隊的OpenAI o1滿血版。
此次Kimi的發(fā)布還伴隨著一份訓練報告《Kimi k1.5:借助大語言模型實現(xiàn)強化學習的Scaling》的公開。這與以往月之暗面閉源發(fā)布產(chǎn)品的做法截然不同,顯示出中國AI廠商在開放性和透明度方面的積極態(tài)度。
自ChatGPT橫空出世以來,中國AI廠商大多在摸著OpenAI的石頭過河。然而,從K1.5等國產(chǎn)大模型的崛起開始,我們可以明顯感受到,以往以歐美為中心的AI行業(yè)格局正在悄然發(fā)生變化。
近三個月來,月之暗面團隊的技術成果頻出。從去年11月的k0-math數(shù)學模型,到12月的k1視覺思考模型,再到如今的K系列強化學習模型的重磅升級,月之暗面無疑正處于技術爆發(fā)的黃金時期。
與國內(nèi)廠商和用戶的熱烈反響相比,國外尤其是硅谷專業(yè)人士的反應或許更能說明問題。面對月之暗面和Deepseek的最新推理模型成果,眾多海外AI大V表現(xiàn)出了極大的興趣和興奮。英偉達大佬Jim Fan甚至發(fā)推感嘆,技術的共享非常重要。
從技術層面來看,K1.5的成功離不開其獨特的“Long2Short”訓練方案。這一方案通過結合長鏈推理模型和小而高效的短模型,實現(xiàn)了在保留長模型推理能力的同時,有效提升了短模型的推理效率和部署優(yōu)勢。K1.5還采用了最短拒絕采樣和DPO等方法,以在有限的測試token預算下,最大程度提升模型性能。
在全球前沿大模型數(shù)學競賽和編程競賽基準測試中,K1.5延續(xù)了此前K0-math的優(yōu)異性能,處于全球第一梯隊。這一成績無疑進一步鞏固了中國AI廠商在國際舞臺上的地位。
如今,隨著K1.5等國產(chǎn)大模型的崛起,中國AI行業(yè)已經(jīng)站在了新的歷史起點上。我們有理由相信,在未來的發(fā)展中,中國AI廠商將繼續(xù)保持這一勢頭,不斷推動全球AI技術的進步和發(fā)展。