ITBear旗下自媒體矩陣:

Kimi發(fā)布新一代數(shù)學模型,楊植麟:聚焦業(yè)務減法,邁向AI新高度

   時間:2024-11-19 07:04:17 來源:ITBEAR作者:每日經(jīng)濟新聞編輯:瑞雪 發(fā)表評論無障礙通道

在科技界的浩瀚星空中,一家名為“月之暗面”的公司猶如一顆神秘的新星,吸引著無數(shù)探索者的目光。近日,借著其旗艦產(chǎn)品Kimi Chat上線一周年的契機,月之暗面創(chuàng)始人楊植麟罕見亮相,向媒體展示了他們“登月”征途中的又一重要里程碑。

在媒體的聚光燈下,楊植麟身著印有公司標志的黑色T恤,宣布了新一代數(shù)學推理模型k0-math的誕生。這款模型在數(shù)學能力上可與全球領先的OpenAI o1系列相媲美,當現(xiàn)場演示k0-math解答數(shù)學題時,楊植麟的眼中閃爍著興奮的光芒,他詳細地解析了模型背后的技術原理。

k0-math是Kimi推出的首款強化推理能力的模型,它采用了前沿的強化學習和思維鏈推理技術,這與楊植麟對行業(yè)技術趨勢的洞察不謀而合。他強調(diào),未來強化學習將成為技術發(fā)展的重點,盡管依然需要擴展(Scaling),但方式將有所不同。

據(jù)月之暗面透露,k0-math在中考、高考、考研以及包含競賽題的MATH等數(shù)學基準測試中,表現(xiàn)優(yōu)異,其初代模型的成績已超越o1-mini和o1-preview,僅次于o1完全版。一位國內(nèi)頂級互聯(lián)網(wǎng)公司的大模型技術人員評價稱,月之暗面很可能是國內(nèi)首個在OpenAI o1發(fā)布后,摸索并實現(xiàn)其思路的公司。他還指出,數(shù)學領域是當前國內(nèi)大模型團隊趕超o1的首選,因為這一領域不需要大量標注數(shù)據(jù),成本較低,且答案可驗證。

面對媒體,楊植麟坦誠地分享了月之暗面的下一步計劃:“Kimi目前的核心任務是提升用戶留存率。”他認為,留存率與技術成熟度和技術水平密切相關,是現(xiàn)階段最重要的目標。他坦言,如果以通用人工智能(AGI)為最終目標來衡量,他們目前仍處于初級階段。

數(shù)據(jù)顯示,截至今年10月,Kimi的月活躍用戶數(shù)已超過3600萬,并持續(xù)增長。在發(fā)布會現(xiàn)場,一張展示k0-math模型發(fā)布瞬間的照片格外引人注目,畫面中,楊植麟站在舞臺中央,自信而堅定。

發(fā)布會上,楊植麟還公布了k0-math在業(yè)界常用數(shù)學能力基準測試MATH中的得分——93.8分,這一成績超過了o1-mini的90分和o1-preview的85.5分,僅次于o1完全版的94.8分。他強調(diào),數(shù)學場景最適合鍛煉AI的思考能力,k0-math在做題時會花費更多時間進行推理,包括思考和規(guī)劃解題思路,并在必要時自我反思和改進。

盡管k0-math在解答高難度數(shù)學題上表現(xiàn)出色,但楊植麟也坦誠指出,當前版本尚無法處理LaTeX格式難以描述的幾何圖形類問題,且可能對過于簡單的數(shù)學問題如“1+1=?”進行過度思考。他透露,k0-math采用了強化學習和思維鏈推理技術,這是OpenAI o1系列的關鍵所在,也是行業(yè)范式正在發(fā)生的變化。

楊植麟還分享了月之暗面對Scaling Law(規(guī)模法則)逐漸放緩的看法,他認為預訓練仍有提升空間,大概半代到一代的模型將在明年迎來突破。他強調(diào),未來最重點的是強化學習,范式將發(fā)生變化,但仍需通過不同的方式進行擴展。

在談及業(yè)務聚焦時,楊植麟表示,月之暗面近期主動做了業(yè)務減法,停止了Ohai和Noisee兩款出海產(chǎn)品的更新,暫時收縮了出海to C應用。他解釋稱,這一決策是基于對美國市場的觀察和公司業(yè)務發(fā)展的判斷,他們希望保持團隊的精干和高效,避免過度擴張對創(chuàng)新造成致命傷害。

對于Kimi而言,提升留存率是當前最核心的任務。楊植麟表示,留存率是技術成熟的重要指標,仍有很大的提升空間。他透露,第三方機構(gòu)的數(shù)據(jù)顯示,截至今年9月,Kimi的3日留存率為32.2%,他們將通過提升模型思考能力和豐富交互方式來提高留存率。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version