近日,全球最大AI開(kāi)源社區(qū)Huggingface發(fā)布了最新的開(kāi)源大模型榜單(Open LLM Leaderboard),榜單顯示,其排名前十的開(kāi)源大模型全部是基于阿里通義千問(wèn)(Qwen)開(kāi)源模型二次訓(xùn)練的衍生模型。該榜單是目前全球最具權(quán)威性的開(kāi)源大模型榜單,其測(cè)試維度涵蓋閱讀理解、邏輯推理、數(shù)學(xué)計(jì)算、事實(shí)問(wèn)答等。
![](http://m.jsbuxiugang.com/file/upload/202502/10/154015914.png)
(圖源 Huggingface2月10日官網(wǎng)榜單截圖)
通義千問(wèn)Qwen大模型已經(jīng)成為全球最大的開(kāi)源模型族群。在海內(nèi)外開(kāi)源社區(qū)中,Qwen的衍生模型數(shù)量已突破9萬(wàn),超越美國(guó)meta公司旗下的Llama系列開(kāi)源模型,位居全球第一。在Hugging face2024年的開(kāi)源模型下載中,Qwen模型系列中的Qwen2.5-1.5B-Instruct的下載量占總下載量的26.6%,是全球下載量最高的開(kāi)源模型。在這一輪推理模型技術(shù)浪潮中,Qwen系列模型廣受歡迎。此前爆火的DeepSeek公司基于R1推理模型蒸餾了6個(gè)模型開(kāi)源給社區(qū),其中有4個(gè)模型來(lái)自Qwen。近期,著名AI科學(xué)家李飛飛團(tuán)隊(duì)用較少的資源和數(shù)據(jù)訓(xùn)練出的s1推理模型同樣以Qwen模型為基礎(chǔ)模型。國(guó)內(nèi)外開(kāi)發(fā)者認(rèn)為,以上模型取得的良好成績(jī)跟基礎(chǔ)模型的強(qiáng)大性能有很大關(guān)系。
從2023年8月起,阿里云通義千問(wèn)相繼開(kāi)源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型等數(shù)十款,多次登上國(guó)內(nèi)外權(quán)威大模型榜單,已成為開(kāi)源社區(qū)最重要的模型系列。