滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

DeepSeek V3低成本高效能，AI界“拼多多”模式能否引領(lǐng)新潮流？

時(shí)間：2025-01-06 16:07:13 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

在2024年末，AI領(lǐng)域迎來了一次新的震撼，DeepSeek公司推出的新一代MoE模型DeepSeek-V3，不僅在性能上達(dá)到了行業(yè)領(lǐng)先水平，更因其在成本控制上的卓越表現(xiàn)而引發(fā)了廣泛關(guān)注。

這家獨(dú)立于主流大模型公司之外的新興勢(shì)力，發(fā)布了DeepSeek-V3的首個(gè)版本，并大方地選擇了開源。這款模型擁有驚人的6710億參數(shù)，其中370億為激活參數(shù)，其預(yù)訓(xùn)練數(shù)據(jù)更是高達(dá)14.8萬億token。在知識(shí)類任務(wù)及代碼能力上，DeepSeek-V3與業(yè)界頂尖模型Claude-3.5-Sonnet-1022不相上下，甚至在數(shù)學(xué)能力上超越了多個(gè)知名開源與閉源模型。

然而，DeepSeek-V3真正引起轟動(dòng)的，并非僅僅是其卓越的性能，而是其低廉的訓(xùn)練成本。據(jù)DeepSeek公布的數(shù)據(jù)，該模型的總訓(xùn)練成本僅為557.6萬美元，完整訓(xùn)練消耗了278.8萬個(gè)GPU小時(shí)，僅為同等性能水平模型訓(xùn)練成本的十分之一。這一消息在國(guó)內(nèi)外迅速傳播，使得DeepSeek成為了業(yè)界的焦點(diǎn)。

回顧2024年初，DeepSeek就曾憑借“MoE架構(gòu)+MLA（Multi-head Latent Attention）技術(shù)”在降低大模型使用成本上取得了顯著成果，從而引發(fā)了API價(jià)格戰(zhàn)。如今，這一創(chuàng)新技術(shù)在DeepSeek-V3上得到了進(jìn)一步的鞏固和完善。

面對(duì)DeepSeek的強(qiáng)勢(shì)崛起，其他大模型公司不得不重新審視這位低調(diào)而穩(wěn)定的競(jìng)爭(zhēng)對(duì)手。DeepSeek的每一次進(jìn)步，都可能成為對(duì)其他公司的商業(yè)奇襲。

DeepSeek-V3的低成本訓(xùn)練模式，引發(fā)了業(yè)界對(duì)于AI模型開發(fā)成本控制的深入思考。尤其是在英偉達(dá)高端GPU顯卡在中國(guó)大陸受限的背景下，算力不足成為了國(guó)內(nèi)AI公司面臨的一大難題。而DeepSeek背后的開發(fā)公司幻方，憑借其雄厚的算力儲(chǔ)備，成為了少數(shù)能夠應(yīng)對(duì)這一挑戰(zhàn)的公司之一。

據(jù)悉，DeepSeek-V3的訓(xùn)練僅使用了2048張英偉達(dá)H800 GPU（H100 GPU的特供版），便完成了如此大規(guī)模的模型訓(xùn)練。相比之下，meta旗下的開源模型Llama-3.1則動(dòng)用了超過16000張英偉達(dá)H100 GPU，訓(xùn)練成本高達(dá)數(shù)億美元。這一對(duì)比，無疑彰顯了DeepSeek在成本控制上的卓越能力。

DeepSeek-V3的成功，不僅在于其低廉的訓(xùn)練成本，更在于其背后的一系列創(chuàng)新技術(shù)。模型壓縮、專家并行訓(xùn)練、FP8混合精度訓(xùn)練等技術(shù)，共同構(gòu)成了DeepSeek-V3的低成本訓(xùn)練模式。這些技術(shù)的引入，不僅降低了模型開發(fā)的成本，也為行業(yè)探索低成本訓(xùn)練模式提供了新的思路。

然而，要復(fù)制DeepSeek的成功并不容易。FP8訓(xùn)練技術(shù)雖然具有顯著的成本優(yōu)勢(shì)，但也帶來了模型精度不足和性能不穩(wěn)定的風(fēng)險(xiǎn)。這需要開發(fā)團(tuán)隊(duì)具備強(qiáng)大的調(diào)優(yōu)能力，以確保模型在降低成本的同時(shí)，保持卓越的性能。

DeepSeek在人才儲(chǔ)備上也具有獨(dú)特優(yōu)勢(shì)。其核心團(tuán)隊(duì)由一批本土的頂尖高校畢業(yè)生和年輕人才組成，他們憑借深厚的專業(yè)知識(shí)和創(chuàng)新思維，為DeepSeek的發(fā)展提供了強(qiáng)大的動(dòng)力。這種人才儲(chǔ)備模式，不僅為DeepSeek的技術(shù)創(chuàng)新提供了有力支持，也為公司的未來發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。

隨著DeepSeek-V3的火爆，業(yè)界開始關(guān)注DeepSeek的商業(yè)觸角將向哪個(gè)領(lǐng)域延伸。目前，DeepSeek主要以開源模型API接口服務(wù)開發(fā)者和企業(yè)，但在C端和B端應(yīng)用場(chǎng)景上尚未有明確動(dòng)作。然而，從幻方在招聘平臺(tái)上釋放的崗位信息來看，DeepSeek或許已經(jīng)在籌備自己的C端產(chǎn)品，并有望在數(shù)學(xué)和代碼能力上形成獨(dú)特優(yōu)勢(shì)。

無論如何，DeepSeek憑借其卓越的模型實(shí)力和成本優(yōu)勢(shì)，已經(jīng)成為業(yè)界不可忽視的一股力量。對(duì)于其他大模型公司而言，DeepSeek的崛起無疑是一個(gè)巨大的挑戰(zhàn)和威脅。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

海爾合肥冰箱互聯(lián)工廠：AI領(lǐng)航，榮獲工業(yè)4.0“AI創(chuàng)新領(lǐng)航”全球首獎(jiǎng)！

01-06

AI芯片競(jìng)賽格局生變，博通崛起能否終結(jié)英偉達(dá)獨(dú)霸時(shí)代？

01-06

正陽恒卓高凱：打造高效可靠AI基礎(chǔ)設(shè)施，智算中心建設(shè)需系統(tǒng)思維

01-06

ChatGPT Pro訂閱層級(jí)發(fā)布，高算力需求下OpenAI面臨虧損壓力？

01-06

云自開AI賦能溫江區(qū)公平街道衛(wèi)生中心，智能外呼開啟醫(yī)療服務(wù)新篇章

01-06

2025杰出雇主榜單發(fā)布：企業(yè)如何應(yīng)對(duì)市場(chǎng)挑戰(zhàn)，人才戰(zhàn)略是關(guān)鍵

01-06

中堅(jiān)科技全資設(shè)立機(jī)器人公司，涉足多項(xiàng)人工智能業(yè)務(wù)領(lǐng)域

01-06

魔琺科技AI數(shù)字人：驅(qū)動(dòng)跨境營(yíng)銷新增長(zhǎng)，解鎖出海新篇章

01-06

昆侖萬維「天工大模型4.0」o1版與4o版全量上線，天工APP與網(wǎng)頁免費(fèi)開放！

01-06

奧爾特曼萬字長(zhǎng)文：ChatGPT周活破3億，OpenAI劍指超級(jí)智能新征途

北京時(shí)間1月6日上午，奧爾特曼發(fā)布題為“反思”的1萬字博客文章，敘述OpenAI成立9年來和ChatGPT風(fēng)靡全球的過去兩年發(fā)生的事情和公司未來目標(biāo)。我們?nèi)匀幌嘈?，不斷將出色的AI工具交到人們手中，將帶來廣泛…

01-06

螞蟻集團(tuán)攜手多家企業(yè)增資清微智能，共促可重構(gòu)計(jì)算芯片發(fā)展

三言科技 1月6日消息，天眼查App顯示，近日，北京清微智能科技有限公司發(fā)生工商變更，深圳市卓源高科創(chuàng)業(yè)投資有限公司、LFCInvestment Hong Kong Limited退出股東行列，新增螞蟻集團(tuán)…

01-06

螞蟻集團(tuán)攜手多巨頭入股，清微智能可重構(gòu)計(jì)算芯片研發(fā)迎新機(jī)遇

01-06

具身智能機(jī)器人新趨勢(shì)：人形機(jī)器人將小規(guī)模商用，未來市場(chǎng)規(guī)?？蛇_(dá)7萬億美元

01-06

控?zé)熜绿魬?zhàn)：7500萬煙民待改變，數(shù)字健康方案能否成為新出路？

1月3日，在溫致科技2025年數(shù)字健康新品發(fā)布上，中國(guó)控?zé)熍c健康協(xié)會(huì)常務(wù)副會(huì)長(zhǎng)兼秘書長(zhǎng)賀青華表示，在《健康中國(guó)2030》綱要中，明確提出到2030年，成年人的吸煙率要從現(xiàn)在的24.1%，降至20%以下。以數(shù)…

01-06

字節(jié)跳動(dòng)自建數(shù)據(jù)中心，2025年計(jì)劃投資1600億打造大規(guī)模集群

01-06

點(diǎn)擊查看更多 +

全站最新

哪吒汽車官網(wǎng)“失聯(lián)”，銷量下滑背后，自救之路能否走通？

宏光MINIEV四門版來襲！205公里續(xù)航，“焦奶油”內(nèi)飾美翻天

Redmi Turbo 4性能爆棚：天璣8400-Ultra助力，越級(jí)挑戰(zhàn)旗艦機(jī)？

《GTA6》今年發(fā)售！玩家自制PS5實(shí)體版搶先看

iPhone 17大變身！全新設(shè)計(jì)能否再次引領(lǐng)潮流？

本田聯(lián)手華為布局智能駕駛，“燁品牌”推遲上市押注新技術(shù)

熱門內(nèi)容

本欄最新

海爾合肥冰箱互聯(lián)工廠：AI領(lǐng)航，榮獲工業(yè)4.0“AI創(chuàng)新領(lǐng)航”全球首獎(jiǎng)！

正陽恒卓高凱：打造高效可靠AI基礎(chǔ)設(shè)施，智算中心建設(shè)需系統(tǒng)思維

ChatGPT Pro訂閱層級(jí)發(fā)布，高算力需求下OpenAI面臨虧損壓力？

云自開AI賦能溫江區(qū)公平街道衛(wèi)生中心，智能外呼開啟醫(yī)療服務(wù)新篇章

2025杰出雇主榜單發(fā)布：企業(yè)如何應(yīng)對(duì)市場(chǎng)挑戰(zhàn)，人才戰(zhàn)略是關(guān)鍵

中堅(jiān)科技全資設(shè)立機(jī)器人公司，涉足多項(xiàng)人工智能業(yè)務(wù)領(lǐng)域

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

DeepSeek V3低成本高效能，AI界“拼多多”模式能否引領(lǐng)新潮流？

DeepSeek V3低成本高效能，AI界“拼多多”模式能否引領(lǐng)新潮流？