ITBear旗下自媒體矩陣:

DeepSeek:中國AI新星,能否重塑行業(yè)格局?

   時間:2025-02-02 08:43:07 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

在剛剛過去的春節(jié)假期,一款名為DeepSeek的AI產(chǎn)品席卷全球科技圈,成為科技愛好者們熱議的焦點。這款由中國科技公司深度求索推出的推理模型DeepSeek-R1,憑借其卓越的性能和低廉的成本,成功吸引了全球的目光。

1月20日,深度求索公司正式推出了DeepSeek-R1。據(jù)官方介紹,該模型在性能上與OpenAI的最新模型GPT-o1相當,但訓(xùn)練成本僅為OpenAI的十分之一。這一消息迅速引發(fā)了全球科技界的轟動,DeepSeek也因此成為了全球范圍內(nèi)首個超越OpenAI ChatGPT的產(chǎn)品。

其實,DeepSeek的出色表現(xiàn)并非偶然。早在去年5月,深度求索就曾以DeepSeek-V2的超低價格在國內(nèi)AI行業(yè)引發(fā)關(guān)注。當時,DeepSeek-V2的價格僅為GPT-4-Turbo的近百分之一。此后,字節(jié)、百度、阿里等公司的大模型紛紛降價,而DeepSeek更是一年內(nèi)三次降價,每次降幅都超過85%。

DeepSeek之所以能夠如此“摳門”,關(guān)鍵在于其獨特的訓(xùn)練方式和算法優(yōu)化。公司研究人員提出了一種新的MLA架構(gòu),與DeepSeek MoESparse結(jié)合,將顯存占用降到了其他大模型最常用的MHA架構(gòu)的5%-13%。同時,DeepSeek還采用了“數(shù)據(jù)蒸餾”技術(shù),通過用高精度的通用大模型當老師,高效訓(xùn)練學(xué)生模型,從而大大降低了數(shù)據(jù)計算量。

這種“低成本、高性能”的初始規(guī)劃,讓DeepSeek在訓(xùn)練和推理成本上取得了顯著優(yōu)勢。R1的預(yù)訓(xùn)練費用僅為557.6萬美元,在2048塊英偉達H800 GPU集群上運行55天即可完成。相比之下,OpenAI等企業(yè)訓(xùn)練模型需要數(shù)千甚至上萬塊高算力的頂級顯卡,花費數(shù)億美元的訓(xùn)練成本。

除了成本優(yōu)勢外,DeepSeek還選擇了從垂直場景切入,追求在部分領(lǐng)域(如數(shù)學(xué)、代碼)的表現(xiàn)更優(yōu)。這種另辟蹊徑的策略讓DeepSeek在與OpenAI等“通用巨獸”的競爭中展現(xiàn)出了同等能力甚至略微領(lǐng)先。DeepSeek R1與OpenAI O1正式版在數(shù)學(xué)、代碼、自然語言推理等任務(wù)下的測試成績相當,足以證明其實力。

DeepSeek的脫穎而出還與其堅持的免費開源主張密不可分。公司公開了模型的源代碼、權(quán)重和架構(gòu),無論是個人開發(fā)者還是企業(yè)用戶都可以免費使用其最新模型,并在此基礎(chǔ)上開發(fā)更多應(yīng)用。這一決策得到了許多行業(yè)專家和投資者的贊許,也讓DeepSeek在全球范圍內(nèi)快速建立了生態(tài)。

英偉達高級研究科學(xué)家Jim Fan評論稱:“我們生活在這樣一個時代,一家非美國公司正在讓OpenAI的初衷得以延續(xù),即做真正開放、為所有人賦能的前沿研究?!惫韫蕊L投A16Z創(chuàng)始人Marc Andreessen也表示:“DeepSeek-R1是我見過的最令人驚嘆且令人印象深刻的一個突破,作為開源的模型,它的面世給世界帶來了一份禮物?!?/p>

DeepSeek的開源策略不僅挑戰(zhàn)了傳統(tǒng)大廠的技術(shù)壟斷,也為其自身發(fā)展帶來了更多可能性。通過開源策略,DeepSeek可以快速建立生態(tài),獲得更多的用戶和開發(fā)者支持。未來,DeepSeek計劃通過企業(yè)版工具鏈(如模塊訓(xùn)練平臺)推進商業(yè)化,成為更多公司的模型底座。

DeepSeek的崛起不僅讓中國AI行業(yè)看到了希望,也為全球AI競賽帶來了新的變數(shù)。在AI技術(shù)日新月異的今天,創(chuàng)新和模仿的差別將決定中國科技公司與美國科技公司之間的差距。而這一次,DeepSeek代表的中國科技公司給出的方案不再是模仿跟隨,而是創(chuàng)新。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version