在人工智能領(lǐng)域,訓(xùn)練大型語言模型的費用一直是個引人關(guān)注的話題。OpenAI的首席執(zhí)行官山姆·奧特曼曾透露,GPT-4的訓(xùn)練成本高達1億美元,并預(yù)測未來這一數(shù)字將攀升至10億美元以上。GPT-5的訓(xùn)練更是驚人,僅一輪訓(xùn)練就耗資約5億美元。然而,在這個高成本的行業(yè)中,DeepSeek卻以其極低的訓(xùn)練成本脫穎而出。
據(jù)悉,DeepSeek最新推出的V3大模型,訓(xùn)練成本僅為557.6萬美元,約為GPT-4成本的二十分之一。這一低成本高效率的模型引發(fā)了業(yè)界的廣泛關(guān)注。DeepSeek不僅訓(xùn)練成本低廉,其使用價格也十分親民。官網(wǎng)顯示,其緩存命中輸入價格為0.1元/百萬tokens,輸出價格為2元/百萬tokens,這在眾多AI大模型中屬于最低價位。
為了驗證DeepSeek-V3的實際表現(xiàn),我們進行了多輪測試。首先,在常規(guī)問答測試中,DeepSeek展現(xiàn)了其出色的問答能力。無論是聯(lián)網(wǎng)狀態(tài)還是非聯(lián)網(wǎng)狀態(tài),它都能準(zhǔn)確回答提出的問題,且回答內(nèi)容簡潔明了,可讀性高。在收集新聞方面,DeepSeek不僅提供了清晰的新聞?wù)€附帶了直達新聞源的鏈接,極大地方便了用戶。
在內(nèi)容總結(jié)測試中,DeepSeek雖然未能完全捕捉到原文的所有重點,但其表現(xiàn)依然可圈可點。與眾多AI大模型一樣,DeepSeek在總結(jié)內(nèi)容時容易忽略一些細(xì)節(jié),但總體上能夠提煉出文章的核心觀點。與一些知名AI大模型相比,DeepSeek的表現(xiàn)并不遜色。
接下來是數(shù)學(xué)題解答測試。DeepSeek在這一環(huán)節(jié)中表現(xiàn)尤為出色。它不僅迅速準(zhǔn)確地回答了簡單的小學(xué)數(shù)學(xué)題和經(jīng)典的三門問題,還成功解答了一個曾擊敗多個AI大模型的復(fù)雜問題。在解答過程中,DeepSeek詳細(xì)展示了思考步驟,并反復(fù)驗證答案,確保了答案的準(zhǔn)確性。這一表現(xiàn)無疑讓人眼前一亮。
在金融問題答疑測試中,DeepSeek同樣展現(xiàn)出了其強大的邏輯推理能力。它準(zhǔn)確理解了市場利率變化對債券價格的影響,并給出了合理的投資建議。雖然未開啟聯(lián)網(wǎng)搜索功能,但DeepSeek的回答依然中規(guī)中矩,與其他AI大模型相比毫不遜色。
經(jīng)過多輪測試,我們發(fā)現(xiàn)DeepSeek-V3在文字生成和邏輯推理方面表現(xiàn)出色,但功能相對單一。與豆包、文心一言等AI大模型相比,DeepSeek缺乏圖片創(chuàng)作、PPT生成等多元化功能。然而,對于以文字生成為主要需求的用戶來說,DeepSeek-V3無疑是一款性價比極高的AI大模型。
DeepSeek之所以能夠以如此低的成本訓(xùn)練出如此優(yōu)秀的模型,主要得益于其先進的MoE架構(gòu)、多技術(shù)融合優(yōu)化以及FP8混合精度訓(xùn)練框架等技術(shù)。DeepSeek還與開源社區(qū)緊密合作,共同推動AI技術(shù)的發(fā)展。這種開源節(jié)流的方式不僅降低了成本,還提高了模型的性能。
在AI行業(yè)成本高昂、競爭激烈的背景下,DeepSeek的成功經(jīng)驗無疑為其他AI公司提供了寶貴的借鑒。通過優(yōu)化技術(shù)和加強合作,AI公司可以在降低成本的同時提高模型的性能,從而在這個充滿挑戰(zhàn)的領(lǐng)域中脫穎而出。
雖然DeepSeek在文字生成和邏輯推理方面表現(xiàn)出色,但它在創(chuàng)作圖片、PPT等多元化功能方面仍有待加強。對于需要更多功能的用戶來說,豆包、Kimi等AI大模型及其提供的智能體或許更為合適。然而,對于以文字生成為主要需求的用戶來說,DeepSeek-V3無疑是一個極具性價比的選擇。