周一,美國股市上,英偉達公司的股價遭遇了自2020年3月16日以來最糟糕的一天,收盤時大幅下跌約16.9%。伴隨股價的暴跌,英偉達公司的市值蒸發(fā)了近600億美元,打破了這家人工智能(AI)芯片巨頭去年9月創(chuàng)下的美股上市公司市值單日跌幅最大紀錄。
此次美國AI相關股票的暴跌,源自一家名為DeepSeek的中國AI初創(chuàng)公司的沖擊。本周末,DeepSeek的應用程序在各大應用商店中異軍突起,成功將OpenAI的ChatGPT從蘋果App Store美國區(qū)最熱門免費應用榜榜首拉下馬來。據移動應用分析公司Appfigures的數據,周一,在iOS平臺上,DeepSeek不僅在美國App Store位居榜首,還在全球其他51個國家的應用商店免費應用榜上登頂。
DeepSeek在美國社交媒體平臺X上上周末的AI模型爆火后,其在應用商店的排名也隨之飆升。令人驚訝的是,DeepSeek訓練其V3大型語言模型(LLM)僅耗資558萬美元。該公司聲稱使用了2048個英偉達H800芯片,這是英偉達H100芯片的降級版本,旨在遵守美國的出口限制。DeepSeek僅用260萬H800小時就訓練出了一個遠超meta模型效果的模型,而meta使用其Llama 3模型家族的預算,本可以至少訓練出15個DeepSeek-V3。
本月早些時候,DeepSeek發(fā)布了其開源的DeepSeek-R1推理模型,聲稱其性能可與OpenAI的o1等領先產品相媲美,但成本卻低得多。多個第三方測試發(fā)現(xiàn),DeepSeek的表現(xiàn)實際上超過了OpenAI的最新模型。R1包含671億個參數,其“精簡”版本的大小從15億個參數到70億個參數不等。通過DeepSeek的API,完整版本的R1可以以比o1便宜90%-95%的價格獲得。
知名投資人馬克·安德森周五在X平臺上表示,DeepSeek的推理模型是“我見過的最驚人、最令人印象深刻的突破之一,作為開源產品,它是對世界的一份深刻禮物”。安德森是硅谷有影響力的風險投資公司Andreessen Horowitz的掌門人,他將R1比作“AI領域的斯普特尼克時刻”,指的是1957年蘇聯(lián)發(fā)射第一顆人造地球衛(wèi)星,從而拉開了太空競賽的序幕。
Hugging Face平臺上的開發(fā)者已經創(chuàng)建了500多個R1衍生模型,這些模型的總下載量已達到250萬次,是官方R1下載量的五倍,該平臺CEO克萊姆·德朗格在X上的一篇帖子中說道。
英偉達的一位發(fā)言人表示,DeepSeek是“一項優(yōu)秀的人工智能進步”。這位發(fā)言人在周一接受CNBC采訪時表示:“DeepSeek的工作展示了如何使用這種技術創(chuàng)建新模型,利用廣泛可用的模型和完全符合出口管制要求的計算能力?!?/p>
路透社援引英偉達方面的評論稱,DeepSeek的推理需要大量英偉達圖形處理單元(GPU)和高性能網絡的支持。該公司還強調,DeepSeek使用的是為中國市場設計的獲批GPU版本,以此來反駁有關潛在出口違規(guī)的指控。
經紀公司杰富瑞評論稱,DeepSeek在AI訓練方面的能力,對上周Stargate和meta做出的重大承諾后引發(fā)的資本支出狂熱造成了一定程度的打擊。鑒于DeepSeek的性能可與GPT-4o相媲美,但計算能力卻低得多,杰富瑞認為,這可能對AI領域的企業(yè)造成潛在的負面影響,因為AI企業(yè)面臨著證明其不斷增長的資本支出計劃合理性的壓力,這最終可能導致數據中心收入和利潤增長的軌跡降低。
然而,花旗集團對這一觀點提出了質疑,認為DeepSeek的成就并非沒有使用先進的GPU進行微調或構建其最終模型所基于的基礎LLM,并通過蒸餾技術來實現(xiàn)。花旗集團預計,領先的AI公司不會放棄使用更先進的GPU,因為這些GPU在規(guī)模上提供了更具吸引力的美元/TFLOPs(萬億次浮點運算)性能。