近期,科技界傳來(lái)了一則引人注目的消息。據(jù)三言科技報(bào)道,斯坦福大學(xué)與華盛頓大學(xué)的研究團(tuán)隊(duì)攜手,僅憑不到50美元的云計(jì)算成本,便成功培育出一款名為s1的人工智能推理模型。
這一創(chuàng)新成果迅速引起了業(yè)界的廣泛關(guān)注。阿里云隨后證實(shí),該團(tuán)隊(duì)實(shí)際上是以其開源的阿里通義千問Qwen2.5-32B-Instruct模型為基礎(chǔ),進(jìn)行了進(jìn)一步的探索。研究人員在16塊H100GPU的強(qiáng)大算力支持下,僅通過26分鐘的監(jiān)督微調(diào),便成功訓(xùn)練出了全新的s1-32B模型。
據(jù)悉,這款新模型在數(shù)學(xué)和編碼能力方面展現(xiàn)出了與業(yè)界頂尖推理模型相匹敵的實(shí)力。具體而言,s1-32B在數(shù)學(xué)競(jìng)賽問題上的表現(xiàn)尤為亮眼,其準(zhǔn)確率甚至超過了OpenAI的o1-preview模型高達(dá)27個(gè)百分點(diǎn)。這一成就無(wú)疑為人工智能推理領(lǐng)域注入了新的活力。
s1-32B模型的誕生不僅彰顯了研究團(tuán)隊(duì)在算法和算力方面的深厚積累,也進(jìn)一步驗(yàn)證了開源模型在推動(dòng)人工智能技術(shù)創(chuàng)新中的重要作用。通過充分利用開源資源,并結(jié)合高效的訓(xùn)練策略,研究人員得以在極低的成本下實(shí)現(xiàn)如此顯著的成果。
隨著人工智能技術(shù)的不斷發(fā)展,越來(lái)越多的創(chuàng)新模型將不斷涌現(xiàn)。s1-32B模型的誕生無(wú)疑為這一領(lǐng)域樹立了新的標(biāo)桿,也為未來(lái)的研究提供了寶貴的參考和啟示。