ITBear旗下自媒體矩陣:

低成本訓(xùn)練大突破,DeepSeek能否成為AI界新星?

   時(shí)間:2025-01-02 12:33:38 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近期,杭州的AI創(chuàng)業(yè)公司DeepSeek憑借其開(kāi)源模型DeepSeek-V3在業(yè)界引起了軒然大波。這款模型在各類(lèi)基準(zhǔn)測(cè)試中展現(xiàn)出了與付費(fèi)版GPT-4o相當(dāng)?shù)男阅芩?,但其所依?lài)的訓(xùn)練成本卻遠(yuǎn)低于后者。

尤為值得注意的是,DeepSeek-V3是在中國(guó)公司面臨制裁、算力受限且無(wú)法購(gòu)買(mǎi)足量顯卡的背景下誕生的。通過(guò)采用小數(shù)據(jù)集蒸餾等創(chuàng)新方法,DeepSeek成功降低了模型訓(xùn)練的成本,其總訓(xùn)練成本僅為557.6萬(wàn)美元,相比之下GPT-4o等模型的訓(xùn)練成本高達(dá)1億美元。因此,DeepSeek被形象地稱(chēng)為“AI界的拼多多”。

這一消息不僅挑戰(zhàn)了“大模型的智能程度=英偉達(dá)提供的算力”這一傳統(tǒng)認(rèn)知,還在一定程度上影響了英偉達(dá)的股價(jià)。在消息傳播的過(guò)程中,出現(xiàn)了一種有趣的“出口轉(zhuǎn)內(nèi)銷(xiāo)”再傳出的現(xiàn)象。國(guó)外媒體引述國(guó)內(nèi)消息時(shí),特別強(qiáng)調(diào)了DeepSeek對(duì)GPU需求降低的突破,這標(biāo)志著美國(guó)對(duì)中國(guó)的AI封鎖戰(zhàn)略并未如愿,無(wú)需搭建大型GPU集群也能取得顯著效果。這一觀點(diǎn)在Twitter等社交媒體上被重新譯介后,引起了硅谷業(yè)內(nèi)人士的廣泛關(guān)注。

與此同時(shí),DeepSeek的團(tuán)隊(duì)成員也備受矚目。此前,DeepSeek的前員工羅福莉加入小米的消息在業(yè)界流傳甚廣,盡管她早已自我官宣,但“95后天才少女”的稱(chēng)號(hào)無(wú)疑為這一消息增添了更多的話題性。這一事件不僅提升了小米的關(guān)注度,更從側(cè)面證明了DeepSeek團(tuán)隊(duì)的實(shí)力和吸引力。

在DeepSeek出圈之前,AI業(yè)界對(duì)其評(píng)價(jià)頗高。盡管有人指出其訓(xùn)練數(shù)據(jù)集可能使用了ChatGPT的輸出結(jié)果,但這一插曲并未影響DeepSeek的聲譽(yù)。畢竟,如果僅憑ChatGPT的輸出就能取得如此成果,那么任何人都可以嘗試。事實(shí)上,谷歌也在采用類(lèi)似的方法,其Gemini模型的事實(shí)核查人員是外包的,并允許他們借助其他模型生成的結(jié)果來(lái)核對(duì)答案。

在AI領(lǐng)域,提出新概念往往意味著巨大的商業(yè)機(jī)會(huì)。DeepSeek提出的“低成本訓(xùn)練”概念正是如此。與此類(lèi)似,月之暗面(Kimi)因提出“超長(zhǎng)文本(tokens)”概念而走紅,并獲得了大量的融資和關(guān)注。然而,隨著時(shí)間的推移,Kimi的產(chǎn)品發(fā)布和創(chuàng)新能力逐漸放緩,其關(guān)注度也有所下降。這再次證明了新概念對(duì)于創(chuàng)業(yè)公司的重要性。

相比之下,DeepSeek憑借其低成本訓(xùn)練概念在業(yè)界嶄露頭角。如果今年各大廠商還在尋找新的投資標(biāo)的,那么DeepSeek無(wú)疑是一個(gè)值得考慮的選擇。畢竟,能夠定義一個(gè)新概念并引領(lǐng)行業(yè)潮流的創(chuàng)業(yè)公司并不多見(jiàn)。對(duì)于DeepSeek來(lái)說(shuō),其未來(lái)的發(fā)展前景充滿(mǎn)了無(wú)限可能。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容