ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

微軟rStar-Math技術助力，小語言模型數(shù)學推理能力大飛躍！

時間：2025-01-11 12:41:38 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

微軟亞洲研究院的數(shù)學與人工智能研究團隊近日取得了一項新的技術突破，他們專為解決數(shù)學問題設計并開發(fā)了名為rStar-Math的技術。這項技術于1月10日通過官方博文正式對外公布。

與微軟此前推出的Phi-4技術相比，rStar-Math采用了蒙特卡洛樹搜索（Monte Carlo Tree Search）進行推理。這種方法模擬了人類逐步解決問題的思維方式，通過將復雜問題分解成更小的部分，逐步求解，從而提高了解決數(shù)學問題的效率。

在開發(fā)過程中，研究團隊要求模型輸出自然語言描述和Python代碼形式的“思維鏈”步驟，并將自然語言作為Python代碼的注釋。他們僅使用Python代碼輸出進行訓練，這一做法旨在使模型更加清晰地展示其解題過程。

為了進一步提升模型的性能，研究團隊還訓練了一個“策略模型”來生成數(shù)學推理步驟，并使用“過程偏好模型”（PPM）來選擇最有希望的解題步驟。這兩個模型通過四輪“自我進化”相互改進，不斷優(yōu)化其解題能力。

在訓練過程中，研究團隊使用了74萬道公開的數(shù)學應用題及其解答作為初始數(shù)據(jù)，并利用上述兩個模型生成了新的解題步驟。這一做法不僅豐富了訓練數(shù)據(jù)，還有助于模型更好地理解和解決數(shù)學問題。

測試結果顯示，應用rStar-Math技術后，Qwen2.5-Math-7B模型的準確率從58.8%躍升至90.0%，Phi3-mini-3.8B模型的準確率也從41.4%提升到86.4%。與OpenAI的o1-preview模型相比，rStar-Math技術在兩個模型上的表現(xiàn)分別高出4.5%和0.9%。

為了讓其他研究者能夠使用和改進rStar-Math技術，研究團隊已在Hugging Face上宣布，他們計劃將rStar-Math的代碼和數(shù)據(jù)在GitHub上公開。這一舉措將促進數(shù)學與人工智能領域的交流與合作，推動相關技術的進一步發(fā)展。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

抖音重拳出擊！AI生成災害場景，23652條不實信息被嚴處

01-11

周鴻祎：放棄大模型執(zhí)念，專注應用之路同樣偉大

01-11

硅谷巨頭融資火爆卻遲遲不IPO，私有化潮流將持續(xù)？

01-11

微軟CES 2025：聚焦AI合作與出海戰(zhàn)略，公布六大AI預測

微軟總裁 BradSmith發(fā)文表示，微軟50年歷史的很大一部分與知識型員工的培養(yǎng)息息相關，這些員工推動了美國和許多其他國家的現(xiàn)代服務經(jīng)濟，PC/移動時代創(chuàng)造了一個擁有超過10 億此類員工的全球經(jīng)濟。 …

01-11

扎克伯格炮轟蘋果：創(chuàng)新停滯，僅靠“啃老”度日？

01-11

周鴻祎：大模型應用發(fā)展同樣重要，別再盲目卷算力數(shù)據(jù)

對于大模型，周鴻祎稱希望把它分成兩條路，一條是AGI之路，這是承載人類的夢想。他表示，不要把應用之路和AGI之路劃分，有些公司就沒有搞清楚究竟是做AGI還是做應用?！安灰吖浪哪芰Γ膊灰凸浪臐摿Α薄?/div>

01-11

抖音重拳出擊AI地震謠言，已處理上萬條不實信息

01-11

中文互聯(lián)網(wǎng)語料資源大平臺上線，27個數(shù)據(jù)集總量達2.7T！

01-11

抖音重拳出擊AI地震謠言，已處理超兩萬條不實信息

全網(wǎng)出現(xiàn)多起不當利用AI技術生成災害場景的情況，給救災工作帶來了干擾。平臺發(fā)現(xiàn)，有部分用戶發(fā)布AI生成的災難圖片時，自認為這是“藝術創(chuàng)作”，目的是“祈?！?，主觀上并非要“造謠”。在此平臺重申，AI創(chuàng)作易讓人…

01-10

2025數(shù)據(jù)中心行業(yè)展望：預制化、綠色化、智能化運維成新趨勢

01-10

林園解讀2025年A股：企穩(wěn)向上，聚焦快消與養(yǎng)老高股息板塊

01-10

法拉第未來FX品牌LOGO亮相，以無窮符號∞寓意無限可能

01-10

AAEON首款顯卡亮相！華碩子公司進軍市場，搭載Intel Arc A750E GPU

01-10

A股人形機器人概念火爆，機構布局背后有何玄機？

提起人形機器人概念本周的這波大漲，最直接的誘因，應該就是美國當?shù)貢r間1月7日至10日，在拉斯維加斯開幕的2025 CES全球消費電子展。受這些消息刺激，1月9日A股人形機器人概念繼續(xù)高歌猛進，當日大漲3.…

01-10

2025大模型激變，中國AI巨頭領跑，創(chuàng)企如何破局？技術硬實力是關鍵！

從Questel這份報告中我們能看出，百度作為在深度學習和大模型領域跑在最前列的企業(yè)，其技術和生態(tài)都給AI產(chǎn)業(yè)的發(fā)展帶來了諸多推動作用，成為全球行業(yè)智能化升級的主要推手之一，不論對于消費者還是企業(yè)，都是如此…

01-10

點擊查看更多 +

全站最新

煥新版Model Y悄然上市，價格上漲，升級是否值得買單？

比亞迪海豹06 DM-i日規(guī)版新車申報完成，上半年即將登陸日本市場

小鵬G7亮相新車公示，顏值與技術并存，能否成為25萬級SUV新寵？

東風本田新車陣容大揭秘：燁S7、燁GT領銜，多款經(jīng)典車型煥新上市

一汽-大眾加速轉型，20個月推19款新車，混動全覆蓋指日可待

特斯拉Model Y煥新上市，能否繼續(xù)領跑電動車市場？

熱門內(nèi)容

本欄最新

抖音重拳出擊！AI生成災害場景，23652條不實信息被嚴處

周鴻祎：放棄大模型執(zhí)念，專注應用之路同樣偉大

硅谷巨頭融資火爆卻遲遲不IPO，私有化潮流將持續(xù)？

微軟CES 2025：聚焦AI合作與出海戰(zhàn)略，公布六大AI預測

抖音重拳出擊AI地震謠言，已處理上萬條不實信息

林園解讀2025年A股：企穩(wěn)向上，聚焦快消與養(yǎng)老高股息板塊

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

微軟rStar-Math技術助力，小語言模型數(shù)學推理能力大飛躍！

微軟rStar-Math技術助力，小語言模型數(shù)學推理能力大飛躍！