2025年春節(jié),科技界的焦點(diǎn)無疑被DeepSeek搶占。這家中國(guó)的大模型創(chuàng)業(yè)公司,在春節(jié)期間以其V3和R1模型的發(fā)布,引發(fā)了全球科技圈的震動(dòng)。
回顧過去三年,每年的春節(jié)都伴隨著一次重大的AI話題討論。2023年,ChatGPT橫空出世;2024年,Sora接力引領(lǐng)潮流。這兩股浪潮均由OpenAI掀起,而到了2025年,DeepSeek的V3與R1則成為了新的主角。
這一數(shù)據(jù)對(duì)比,讓包括meta在內(nèi)的多家硅谷企業(yè)深感震撼,并對(duì)OpenAI過去“大力出奇跡”的成功方法論產(chǎn)生了質(zhì)疑。這一連串的震撼甚至引發(fā)了硅谷多家科技巨頭的市值暴跌,其中英偉達(dá)一夜之間市值蒸發(fā)了4.3萬億,這相當(dāng)于騰訊與美團(tuán)兩家中國(guó)互聯(lián)網(wǎng)巨頭市值的總和。
DeepSeek的崛起,讓業(yè)界不禁聯(lián)想到美國(guó)可能會(huì)出臺(tái)的一系列制裁政策。然而,就在DeepSeek引發(fā)硅谷地震前不久,1月15日,美國(guó)剛剛將中國(guó)最早的大模型創(chuàng)業(yè)公司“智譜AI”列入了實(shí)體清單。在AI 1.0時(shí)代,商湯、曠視等企業(yè)也曾遭遇過類似的待遇。被列入實(shí)體清單意味著難以購買海外生產(chǎn)的GPU,這在短期內(nèi)仍是大模型訓(xùn)練升級(jí)的重要條件。然而,DeepSeek的成功卻證明了,無論美國(guó)采取何種“卡脖子”措施,都無法阻擋中國(guó)AI技術(shù)的持續(xù)創(chuàng)新。
事實(shí)上,在DeepSeek之前,中國(guó)的大模型已經(jīng)在默默耕耘。2024年被稱為“中國(guó)大模型元年”,多家創(chuàng)業(yè)公司發(fā)布了眾多模型,其中不乏開源的。例如,智譜AI在一年內(nèi)就發(fā)布了超過10款基座模型,覆蓋了文本、圖像、語音、視頻、代碼生成等多個(gè)領(lǐng)域。而階躍星辰也發(fā)布了多款模型,包括多模態(tài)大模型、圖像生成大模型等。這些模型的發(fā)布,不僅數(shù)量眾多,而且在模態(tài)、尺寸、性能上也實(shí)現(xiàn)了全面覆蓋。
DeepSeek的震撼之處在于,它不僅在技術(shù)上實(shí)現(xiàn)了突破,而且其開源的做法也打破了OpenAI等公司的閉源模式。這使得更多的中國(guó)團(tuán)隊(duì)能夠參與到大模型的研發(fā)中來,推動(dòng)了中國(guó)AI技術(shù)的快速發(fā)展。據(jù)不完全統(tǒng)計(jì),從2024年到2025年1月,中國(guó)的大模型創(chuàng)業(yè)公司就發(fā)布了超過50個(gè)模型。
DeepSeek的崛起,也引發(fā)了業(yè)界對(duì)于中美AI較量的重新思考。過去,中國(guó)的大模型在技術(shù)上一直跟隨美國(guó)的步伐。然而,DeepSeek的成功卻證明了中國(guó)在大模型上的AI能力已經(jīng)與美國(guó)的時(shí)間差距越來越小。這不僅體現(xiàn)在技術(shù)上,更體現(xiàn)在創(chuàng)新能力和市場(chǎng)應(yīng)用上。
DeepSeek的V3和R1模型不僅在算力上實(shí)現(xiàn)了突破,而且在技術(shù)上也有諸多創(chuàng)新。例如,R1模型采用了混合專家模型(MoE)、多頭潛注意力(MLA)等設(shè)計(jì),并進(jìn)行了只采用強(qiáng)化學(xué)習(xí)(RL)而不進(jìn)行監(jiān)督微調(diào)(SFT)的訓(xùn)練嘗試。這些創(chuàng)新使得R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能比肩OpenAI的o1正式版。
DeepSeek的成功也為中國(guó)的大模型創(chuàng)業(yè)公司帶來了新的機(jī)遇和挑戰(zhàn)。一方面,DeepSeek的開源做法使得更多的中國(guó)團(tuán)隊(duì)能夠參與到大模型的研發(fā)中來,推動(dòng)了中國(guó)AI技術(shù)的快速發(fā)展。另一方面,DeepSeek的崛起也引發(fā)了其他大模型公司的競(jìng)爭(zhēng)和反思。許多公司開始重新審視自己的技術(shù)路線和商業(yè)模式,并尋求在技術(shù)和產(chǎn)品上的創(chuàng)新。
在DeepSeek的帶動(dòng)下,中國(guó)的大模型創(chuàng)業(yè)公司紛紛加大了在技術(shù)和產(chǎn)品上的投入。例如,智譜AI在發(fā)布多款基座模型的同時(shí),還開源了多款模型供業(yè)界使用。而階躍星辰也在不斷更新和升級(jí)自己的模型產(chǎn)品。
一些專注于C端產(chǎn)品應(yīng)用的創(chuàng)業(yè)公司也開始發(fā)力大模型市場(chǎng)。例如,月之暗面和MiniMax都發(fā)布了多款針對(duì)C端用戶的產(chǎn)品。這些產(chǎn)品的發(fā)布不僅豐富了市場(chǎng)選擇,也推動(dòng)了中國(guó)AI技術(shù)的普及和應(yīng)用。
DeepSeek的崛起不僅是中國(guó)AI技術(shù)的勝利,更是全球AI技術(shù)發(fā)展的一個(gè)重要里程碑。它證明了開源和創(chuàng)新的力量是無窮的,也為中國(guó)的大模型創(chuàng)業(yè)公司帶來了新的機(jī)遇和挑戰(zhàn)。在未來的發(fā)展中,中國(guó)的大模型創(chuàng)業(yè)公司將繼續(xù)發(fā)揮自己在技術(shù)和產(chǎn)品上的優(yōu)勢(shì),推動(dòng)全球AI技術(shù)的快速發(fā)展。