ITBear旗下自媒體矩陣:

中國大模型創(chuàng)業(yè)圈:DeepSeek之后,誰將是下一個(gè)技術(shù)引領(lǐng)者?

   時(shí)間:2025-02-09 20:16:37 來源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

在DeepSeek引發(fā)的風(fēng)暴之后,中國大模型創(chuàng)業(yè)領(lǐng)域正經(jīng)歷一場前所未有的變革。通過與多位行業(yè)專家的深入交流,筆者發(fā)現(xiàn),當(dāng)前國產(chǎn)大模型領(lǐng)域呈現(xiàn)出兩種截然不同的態(tài)勢(shì)。

一方面,那些積極融入DeepSeek生態(tài)的算力提供商、模型服務(wù)商,以及原本無法參與大模型“軍備競賽”的開源受益者,正滿懷熱情地?fù)肀н@一變革。另一方面,以“大模型六小虎”為代表的其他中國大模型創(chuàng)業(yè)公司,以及過去兩年投資了這些公司的風(fēng)險(xiǎn)資本(VC)們,則陷入了深深的憂慮之中,整個(gè)行業(yè)呈現(xiàn)出鮮明的“冰火兩重天”景象。

“為何沒能成為DeepSeek”,以及“為何中國只有一個(gè)DeepSeek”,這兩個(gè)問題自春節(jié)以來就一直困擾著大模型從業(yè)者和VC們。這兩個(gè)問題不僅觸及了國內(nèi)大模型創(chuàng)新的焦慮核心,也是探討如何成為下一個(gè)DeepSeek的關(guān)鍵。

回顧過去四年中國大模型的發(fā)展歷程,我們不禁要問:中國是否缺乏像DeepSeek這樣的技術(shù)理想主義者?如果答案是否定的,那么這樣的技術(shù)團(tuán)隊(duì)是否得到了充分的挖掘和社會(huì)系統(tǒng)性的支持?如果沒有,原因何在?

2023年之前,中國僅有四家大模型公司:智譜、面壁、深言與聆心(后被智譜收購),且均出自清華大學(xué)。2023年之后,大模型創(chuàng)業(yè)公司激增至十余家,技術(shù)上的直接原因是Llama的開源,但更深層次的原因在于,當(dāng)時(shí)普遍認(rèn)為大模型的技術(shù)門檻雖高,但并非不可模仿,尤其是基于開源大模型,技術(shù)難度進(jìn)一步降低,“技術(shù)不構(gòu)成商業(yè)壁壘”的觀點(diǎn)甚囂塵上。

在這種共識(shí)下,2023年ChatGPT爆火后,中國大模型創(chuàng)業(yè)領(lǐng)域的動(dòng)態(tài)呈現(xiàn)出一種畸形現(xiàn)象。智譜成為資本的寵兒,最早突破200億人民幣估值大關(guān),而同樣出自清華自然語言處理實(shí)驗(yàn)室(THUNLP)的面壁和深言,在資本市場的表現(xiàn)卻遠(yuǎn)不如后來者。尤其是面壁智能,作為國內(nèi)最早提出要做“平民版大模型”的公司,甚至比DeepSeek還早成立,但直到2024年年底完成一筆3億人民幣的融資后,估值仍不到35億人民幣。

據(jù)雷峰網(wǎng)AI科技評(píng)論與多位大模型投資人的交流,智譜與面壁在資本市場表現(xiàn)迥異的原因主要在于:清華學(xué)術(shù)派在投資大模型時(shí)往往只選擇一家,且對(duì)教授創(chuàng)業(yè)持保留意見;智譜的愿景更易于理解,對(duì)外融資時(shí)提出“對(duì)標(biāo)OpenAI”,VC立刻就能明白,而面壁一開始強(qiáng)調(diào)底層模型訓(xùn)練效率優(yōu)化,在熱錢最多的2023年一度被認(rèn)為是一家類似潞晨、硅基的“AI Infra”公司。

2023年大模型浪潮來臨后,中國的AI科技VC并未深入研究AGI技術(shù),而是迅速將資金投向了“曾打過勝仗的連續(xù)成功創(chuàng)業(yè)者”,哪怕這些團(tuán)隊(duì)此前從未涉足大模型研發(fā)。光年之外與百川智能就是典型代表。當(dāng)前估值超過200億人民幣的大模型公司中,只有智譜唐杰、月之暗面楊植麟等人是從2020年大模型未出圈時(shí)就開始技術(shù)探索的。

DeepSeek的研發(fā)團(tuán)隊(duì)同樣是從零開始學(xué)習(xí)大模型技術(shù),通過苦讀論文、死磕實(shí)驗(yàn),最終取得了顯著成果。然而,從過去兩年的行業(yè)發(fā)展來看,百川智能在基座模型上的升級(jí)并不頻繁,重心轉(zhuǎn)向醫(yī)療行業(yè)大模型。這種轉(zhuǎn)變雖然對(duì)百川有利,但對(duì)整個(gè)大模型行業(yè)的發(fā)展貢獻(xiàn)有限。

在資源有限的情況下,沒有技術(shù)能力的團(tuán)隊(duì)占據(jù)大量資本資源,而有技術(shù)能力的團(tuán)隊(duì)卻只能獲得極少的資本支持,這種系統(tǒng)性錯(cuò)位注定會(huì)產(chǎn)生遺憾。如果AGI大模型技術(shù)已無上升空間,各家的技術(shù)壁壘逐漸拉平,那么互聯(lián)網(wǎng)時(shí)代拼資源、拼資本的打法或許還能分到一杯羹。但對(duì)技術(shù)有敬畏之心的創(chuàng)業(yè)者始終保持清醒頭腦,他們能看到現(xiàn)有大模型底層算法與架構(gòu)在訓(xùn)練與推理中的不足,知道AGI仍有許多具體且高難度的問題要解決。

底層技術(shù)的持續(xù)創(chuàng)新能力仍是大模型公司的護(hù)城河,純拼資源的互聯(lián)網(wǎng)方法論暫不適用當(dāng)前中國的大模型發(fā)展。一個(gè)不愿意學(xué)習(xí)技術(shù)的VC,比一個(gè)不愿意學(xué)習(xí)技術(shù)的研發(fā)團(tuán)隊(duì)所產(chǎn)生的殺傷力可能更大。

DeepSeek的成功不僅在于其過硬的技術(shù)實(shí)力,更在于其對(duì)AGI的純粹追求。DeepSeek專注AGI研究,依托梁文鋒個(gè)人與幻方量化的原有儲(chǔ)備資金,沒有向外融資。這種“自己有錢,所以不需要聽外界的,自己想干什么就干什么”的自在,讓DeepSeek能夠?qū)W⒂诩夹g(shù)探索,不受外界干擾。

DeepSeek的成功或許無法復(fù)制,但其對(duì)人才的重視程度值得借鑒。DeepSeek的招聘門檻非常高,團(tuán)隊(duì)規(guī)模雖不大,但成員大多是原幻方的技術(shù)高手。他們不僅擁有頂尖的技術(shù)能力,更有著對(duì)技術(shù)的敬畏之心和好奇之心。DeepSeek的內(nèi)部組織文化也非常扁平,只有一個(gè)老板:梁文鋒。這種集權(quán)風(fēng)格明顯的扁平化管理,使得團(tuán)隊(duì)在遇到困難時(shí)能夠自上而下協(xié)調(diào)資源,快速達(dá)到上傳下達(dá)的效果。

梁文鋒的個(gè)人風(fēng)格也十分明顯:有極強(qiáng)的技術(shù)信仰,對(duì)AGI有十足的好奇心與求知欲,并且十分刻苦。他說話非常簡潔,但往往一針見血。這種對(duì)技術(shù)的執(zhí)著和追求,正是DeepSeek能夠取得成功的關(guān)鍵。

DeepSeek的成功不僅改變了VC對(duì)大模型公司的看法,更讓整個(gè)行業(yè)意識(shí)到,AGI的實(shí)現(xiàn)仍需要理想主義。在DeepSeek之前,“北九坤、南幻方”已經(jīng)在金融量化領(lǐng)域鼎鼎有名,而量化行業(yè)對(duì)技術(shù)人才的高要求也是眾所周知的。DeepSeek的成功或許是一個(gè)偶然,但它所展現(xiàn)出的技術(shù)實(shí)力和創(chuàng)新能力,卻為整個(gè)行業(yè)樹立了榜樣。

然而,DeepSeek的成功并非一蹴而就。在DeepSeek之前,也有許多團(tuán)隊(duì)在探索大模型技術(shù),但大多未能取得顯著成果。這并非因?yàn)檫@些團(tuán)隊(duì)缺乏技術(shù)能力或創(chuàng)新精神,而是因?yàn)樗麄兾茨芟馜eepSeek一樣堅(jiān)持對(duì)AGI的純粹追求。許多團(tuán)隊(duì)在探索過程中逐漸轉(zhuǎn)向短期商收或產(chǎn)品打磨,放棄了對(duì)AGI的長期投入。

這種轉(zhuǎn)變不僅反映了市場對(duì)技術(shù)缺乏敬畏之心,也反映了創(chuàng)業(yè)公司在面對(duì)市場壓力和資本誘惑時(shí)的無奈選擇。然而,對(duì)于真正追求AGI的團(tuán)隊(duì)來說,這種轉(zhuǎn)變是不可取的。他們必須堅(jiān)定信念,繼續(xù)投入資源和技術(shù)力量進(jìn)行探索和創(chuàng)新。

事實(shí)上,除了DeepSeek之外,國內(nèi)也有許多團(tuán)隊(duì)在堅(jiān)持創(chuàng)新并不斷探索新的解法來解決懸而未決的難題。例如香港大學(xué)計(jì)算與數(shù)據(jù)科學(xué)研究院院長馬毅教授團(tuán)隊(duì)一直致力于研究可解釋、可控制的人工智能算法與框架(白盒理論);智譜團(tuán)隊(duì)從2021年開始探索多模態(tài)大模型并遇到了許多問題;面壁團(tuán)隊(duì)則指出當(dāng)前主流的大模型架構(gòu)還無法很好地解決經(jīng)驗(yàn)學(xué)習(xí)與空間記憶等關(guān)鍵問題。

隨著具身智能的發(fā)展,AGI也將分為云端AGI與端側(cè)AGI。這一趨勢(shì)為AGI的發(fā)展提供了新的方向和挑戰(zhàn)。要解決這些問題,不僅需要資源投入,更需要強(qiáng)烈的技術(shù)實(shí)力和技術(shù)愿景。DeepSeek的路徑是從底層萬卡集群、HAI框架向上貫穿構(gòu)建環(huán)環(huán)相扣的技術(shù)體系。這種從底層到上層的全面布局和深入探索正是DeepSeek能夠取得成功的關(guān)鍵所在。

在DeepSeek之后,中國的大模型創(chuàng)業(yè)領(lǐng)域?qū)⒑稳ズ螐??這是一個(gè)值得深思的問題。但可以肯定的是,那些能夠堅(jiān)持對(duì)AGI的純粹追求、擁有強(qiáng)大技術(shù)實(shí)力和創(chuàng)新能力的團(tuán)隊(duì)將更有可能成為下一個(gè)DeepSeek。而這些團(tuán)隊(duì)的成功也將為中國AI的崛起注入新的動(dòng)力。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭議稿件處理  |  English Version