ITBear旗下自媒體矩陣:

DeepSeek崛起,能否撼動AI算力市場格局?

   時間:2025-01-28 11:27:45 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

中國藍新聞近日報道,一個名為DeepSeek的開源大模型在杭州悄然崛起,其影響力迅速席卷了整個科技界。自上月以來,DeepSeek已官宣兩大開源模型,被譽為“來自東方的神秘力量”。

1月27日,杭州見證了DeepSeek的又一次重大亮相。游戲科學創(chuàng)始人馮驥,同時也是熱門游戲《黑神話:悟空》的出品人,在公開場合總結了DeepSeek的六大特點:強大、經濟、開源、免費、聯(lián)網、本土。他更斷言,DeepSeek或將成為影響國家命運的科技成果。

DeepSeek的創(chuàng)新之處在于其對通用模型推理步驟的革新。傳統(tǒng)上,模型推理能力的提升依賴于“監(jiān)督微調”,類似于人類的填鴨式教育。然而,DeepSeek-R1直接跳過了這一環(huán)節(jié),進入了“強化學習”階段,探索無監(jiān)督數(shù)據(jù)下的自我進化。通過要求模型寫出思考過程,并利用“獎勵”機制引導模型找到最佳方案,DeepSeek最終實現(xiàn)了模型的“頓悟”。

這一“頓悟”以及其他工程上的優(yōu)化,證明了單純依靠算力和數(shù)據(jù)堆疊的“大力出奇跡”并非通往通用人工智能(AGI)的唯一道路。當優(yōu)雅的算法能夠減少對算力的依賴時,全球算力是否存在過剩的問題,以及未來市場對算力的需求是否需要調整,成為近期全球資本市場動蕩的根源。

DeepSeek的創(chuàng)始人梁文鋒,是一個低調的80后極客。他出生于廣東的一個五線城市,父親是小學老師。梁文鋒畢業(yè)于浙江大學,主修軟件工程,人工智能方向。在創(chuàng)立DeepSeek之前,梁文鋒和他的團隊在金融領域已經取得了顯著成就?;梅搅炕?,DeepSeek的前身,在金融江湖中早已是成名已久的高手。2016年,幻方量化首次上線運行AI策略,2018年確立了成為AI科技公司的目標,最終在2023年7月,梁文鋒在杭州創(chuàng)立了DeepSeek。

盡管DeepSeek至今沒有融資,也沒有接受任何巨頭的投資,但他們卻擁有國內最多的高性能GPU。這一基礎得益于他們在量化投資領域的深耕。梁文鋒透露,DeepSeek的研發(fā)團隊只有139人,約為OpenAI的五分之一,其中包括約70名算法、推理框架、多模態(tài)等研發(fā)工程師及深度學習研究人員。他堅信,中國能夠走出自己的科技模式,引領科技變革。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version