滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

李飛飛團隊s1模型揭秘：基于阿里Qwen，50美元云費用挑戰(zhàn)AI推理巔峰？

時間：2025-02-06 22:55:23 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

近期，李飛飛研究團隊宣布了一項引人注目的成就：他們成功以極低的云計算成本——不到50美元，訓練出了一款名為s1的人工智能推理模型。該模型在數(shù)學解題與編程能力測試中，展現(xiàn)出了與業(yè)界頂尖模型，如OpenAI的o1和DeepSeek的R1相媲美的表現(xiàn)。

然而，這一成果很快引發(fā)了外界的質(zhì)疑。有網(wǎng)友指出，s1模型并非完全從零開始訓練，而是基于阿里云的通義千問（Qwen）模型進行了進一步開發(fā)。為了核實這一信息，新浪科技聯(lián)系了阿里云方面，并得到了確認。

阿里云方面詳細回應稱，s1模型是以阿里通義千問Qwen2.5-32B-Instruct開源模型為基礎(chǔ)，通過16塊H100 GPU進行26分鐘的監(jiān)督微調(diào)后得到的。新模型s1-32B在數(shù)學及編碼能力測試中，取得了與o1和R1等尖端模型相當?shù)男Ч?，甚至在解決競賽數(shù)學問題上的表現(xiàn)，還超出了o1-preview模型27個百分點。

據(jù)了解，s1團隊在創(chuàng)建該模型時，采用了“蒸餾”技術(shù)。這一技術(shù)的核心在于，通過訓練模型來學習另一個已有人工智能模型的答案，從而提取其推理能力。s1的論文指出，他們使用了一種稱為監(jiān)督微調(diào)（SFT）的方法，利用相對較小的數(shù)據(jù)集來實施蒸餾。在SFT過程中，人工智能模型被明確指示在數(shù)據(jù)集中模仿特定的行為模式。

值得注意的是，s1模型是基于阿里巴巴旗下中國人工智能實驗室Qwen提供的一款小型、現(xiàn)成的免費模型進行開發(fā)的。為了訓練s1，研究人員精心策劃了一個包含1000個問題及其答案的數(shù)據(jù)集，同時還參考了谷歌Gemini 2.0 Flash Thinking Experimental為每個答案提供的“思考”過程。

此次s1模型的成功，不僅展示了低成本、高效率訓練人工智能模型的潛力，也引發(fā)了業(yè)界對于模型微調(diào)與蒸餾技術(shù)的進一步關(guān)注。這一成果有望為人工智能領(lǐng)域的發(fā)展帶來新的啟示和動力。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

馬斯克收購OpenAI？奧特曼：董事會尚未見官方文件

02-12

美國首例！湯森路透勝訴，AI版權(quán)糾紛案塵埃落定

02-12

微軟再增389兆瓦可再生能源，力挺AI業(yè)務綠色發(fā)展

02-12

馬斯克欲購OpenAI遭拒，阿爾特曼：這不過是又一次干擾罷了

02-12

2024年AI領(lǐng)域投資熱潮高漲，籌集資金突破1100億美元大關(guān)！

02-12

AI依賴癥？微軟研究：過度使用或讓人喪失批判性思維

02-12

AI推薦彩票中獎5元，DeepSeek真的那么神嗎？

02-12

DeepSeek估值暴增，梁文峰能否成亞洲新科技首富？

02-12

蘋果更新后蘋果智能功能自動重啟，用戶不滿情緒升溫

02-12

蘋果阿里聯(lián)手！國行AI功能將上線，能否助力蘋果在華銷量回升？

作為中國最大的電商和互聯(lián)網(wǎng)科技企業(yè)，阿里很早就布局 AI 大模型技術(shù)，并在2023年推出通義千問Qwen大語言模型技術(shù)，以及通義App產(chǎn)品。值得注意的是，2月11日，蘋果的“宿敵”三星發(fā)布最新款手機Gal…

02-12

DeepSeek熱潮下，馬云現(xiàn)身阿里，AI能否助力阿里股價再創(chuàng)新高？

02-11

馬斯克欲974億競購OpenAI，阿爾特曼：愿與中國在AI領(lǐng)域合作

02-11

AI來襲，銀行人如何借力自救，共舞數(shù)字時代？

郭濤告訴鈦媒體App：通過深入分析用戶行為和需求，DeepSeek能提供更加個性化的服務，這一“智能伙伴”角色不斷深化，會幫助銀行人拓展更多增值服務，實現(xiàn)業(yè)務模式的創(chuàng)新和升級。一些銀行人也很清楚：柜員崗位不…

02-11

61國共簽巴黎人工智能宣言，美英缺席，呼吁加強全球協(xié)調(diào)治理

02-11

三星Galaxy S25 Ultra深度體驗：AI巨屏旗艦的驚喜與不足

02-11

點擊查看更多 +

全站最新

FLAC 1.5新版上線：多線程音頻編碼讓速度起飛，還有哪些升級亮點？

微軟再增389兆瓦可再生能源，力挺AI業(yè)務綠色發(fā)展

蘋果賬戶遷移新功能：輕松轉(zhuǎn)移App、書籍、影音購買內(nèi)容

英特爾新驅(qū)動助力游戲體驗，Arc顯卡暢玩《人中之龍8外傳》

美運營商US Mobile升級套餐：實現(xiàn)真無限高優(yōu)先級數(shù)據(jù)，告別限速時代

東風長安合并傳聞引爆股價，東風汽車能否借此逆風翻盤？

熱門內(nèi)容

本欄最新

微軟再增389兆瓦可再生能源，力挺AI業(yè)務綠色發(fā)展

2024年AI領(lǐng)域投資熱潮高漲，籌集資金突破1100億美元大關(guān)！

AI依賴癥？微軟研究：過度使用或讓人喪失批判性思維

AI推薦彩票中獎5元，DeepSeek真的那么神嗎？

DeepSeek估值暴增，梁文峰能否成亞洲新科技首富？

蘋果更新后蘋果智能功能自動重啟，用戶不滿情緒升溫

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

李飛飛團隊s1模型揭秘：基于阿里Qwen，50美元云費用挑戰(zhàn)AI推理巔峰？

李飛飛團隊s1模型揭秘：基于阿里Qwen，50美元云費用挑戰(zhàn)AI推理巔峰？