【ITBEAR】月之暗面Kimi,這家通用人工智能創(chuàng)業(yè)公司,在今日正式推出了其新一代數(shù)學(xué)推理模型——k0-math。這款模型標(biāo)志著Kimi在推理能力強(qiáng)化方面的首次嘗試。
據(jù)Kimi方面介紹,k0-math在多項(xiàng)基準(zhǔn)測試中表現(xiàn)出色,其數(shù)學(xué)能力足以與全球領(lǐng)先的OpenAI的o1系列模型相媲美,具體對標(biāo)o1-mini和o1-preview兩個可公開使用的模型。
在中考、高考、考研以及MATH等四個不同級別的數(shù)學(xué)基準(zhǔn)測試中,k0-math初代模型的成績均超越了o1-mini和o1-preview。而在更具挑戰(zhàn)性的OMNI-MATH和AIME競賽級數(shù)學(xué)題庫中,k0-math也分別達(dá)到了o1-mini最高成績的90%和83%。
Kimi創(chuàng)始人楊植麟博士表示,當(dāng)前AI領(lǐng)域正經(jīng)歷技術(shù)范式的轉(zhuǎn)變,新技術(shù)如強(qiáng)化學(xué)習(xí)、合成數(shù)據(jù)及思維鏈的應(yīng)用,正逐步解決高質(zhì)量數(shù)據(jù)缺乏的問題,從而推動AI在多個領(lǐng)域和場景中的推理能力及智能水平上限的提升。
k0-math模型采用了這些先進(jìn)技術(shù),特別是強(qiáng)化學(xué)習(xí)和思維鏈推理技術(shù),顯著增強(qiáng)了其數(shù)學(xué)推理能力。通過模擬人類的思考和反思過程,該模型能夠更有效地解決復(fù)雜的數(shù)學(xué)問題,幫助用戶應(yīng)對更具挑戰(zhàn)性的數(shù)學(xué)任務(wù)。
在做題過程中,與常規(guī)模型追求快速給出答案不同,k0-math愿意花更多時(shí)間進(jìn)行推理,包括深入思考和規(guī)劃解題思路,甚至在必要時(shí)進(jìn)行自我反思和改進(jìn),以提高答題的成功率。
Kimi還將這種強(qiáng)化學(xué)習(xí)技術(shù)帶來的推理能力提升應(yīng)用到了日常任務(wù)上。其近期上線的Kimi探索版,在搜索任務(wù)中展現(xiàn)了出色的推理能力,包括意圖增強(qiáng)、信源分析和鏈?zhǔn)剿伎嫉热蠓矫妗?/p>
這些推理能力使得Kimi探索版在處理復(fù)雜搜索調(diào)研任務(wù)時(shí)更加高效,能夠更準(zhǔn)確地理解和拓展用戶的搜索意圖,從海量信息中篩選出權(quán)威可靠的信源,并通過思維鏈推理處理復(fù)雜的研究問題。
據(jù)悉,Kimi智能助手自全面開放以來,已吸引超過3600萬的月度活躍用戶。隨著k0-math數(shù)學(xué)模型和更強(qiáng)大的Kimi探索版的陸續(xù)上線,Kimi有望幫助用戶解決更多具有挑戰(zhàn)性的數(shù)學(xué)和搜索調(diào)研類任務(wù)。