ITBear旗下自媒體矩陣:

李飛飛團(tuán)隊(duì)50美元訓(xùn)AI模型?阿里云:基于我們Qwen2.5微調(diào)而成

   時(shí)間:2025-02-07 13:47:49 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近期,科技界傳來(lái)了一則引人注目的消息。據(jù)三言科技報(bào)道,斯坦福大學(xué)與華盛頓大學(xué)的研究團(tuán)隊(duì)攜手,僅憑不到50美元的云計(jì)算成本,便成功培育出一款名為s1的人工智能推理模型。

這一創(chuàng)新成果迅速引起了業(yè)界的廣泛關(guān)注。阿里云隨后證實(shí),該團(tuán)隊(duì)實(shí)際上是以其開源的阿里通義千問Qwen2.5-32B-Instruct模型為基礎(chǔ),進(jìn)行了進(jìn)一步的探索。研究人員在16塊H100GPU的強(qiáng)大算力支持下,僅通過26分鐘的監(jiān)督微調(diào),便成功訓(xùn)練出了全新的s1-32B模型。

據(jù)悉,這款新模型在數(shù)學(xué)和編碼能力方面展現(xiàn)出了與業(yè)界頂尖推理模型相匹敵的實(shí)力。具體而言,s1-32B在數(shù)學(xué)競(jìng)賽問題上的表現(xiàn)尤為亮眼,其準(zhǔn)確率甚至超過了OpenAI的o1-preview模型高達(dá)27個(gè)百分點(diǎn)。這一成就無(wú)疑為人工智能推理領(lǐng)域注入了新的活力。

s1-32B模型的誕生不僅彰顯了研究團(tuán)隊(duì)在算法和算力方面的深厚積累,也進(jìn)一步驗(yàn)證了開源模型在推動(dòng)人工智能技術(shù)創(chuàng)新中的重要作用。通過充分利用開源資源,并結(jié)合高效的訓(xùn)練策略,研究人員得以在極低的成本下實(shí)現(xiàn)如此顯著的成果。

隨著人工智能技術(shù)的不斷發(fā)展,越來(lái)越多的創(chuàng)新模型將不斷涌現(xiàn)。s1-32B模型的誕生無(wú)疑為這一領(lǐng)域樹立了新的標(biāo)桿,也為未來(lái)的研究提供了寶貴的參考和啟示。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version