在瑞士達(dá)沃斯舉辦的世界經(jīng)濟(jì)論壇上,微軟首席執(zhí)行官薩提亞·納德拉發(fā)表了對中國AI技術(shù)進(jìn)展的高度評價。他特別提到了DeepSeek的新模型,稱贊其在開源模型開發(fā)和推理計算方面的高效表現(xiàn)。
“DeepSeek的新成果確實(shí)令人矚目,”納德拉說道,“特別是在計算效率上,它的表現(xiàn)極為出色。我們必須認(rèn)真對待來自中國的這些技術(shù)突破。”
近期,DeepSeek-R1在大模型競技榜上取得了顯著成績,與ChatGPT-4o并列前三。值得注意的是,DeepSeek-R1以開源和成本效益極高的優(yōu)勢脫穎而出,其價格僅為ChatGPT-4o的二十分之一。此前,已有消息透露,F(xiàn)acebook母公司meta成立了四個專項研究小組,致力于分析DeepSeek的工作原理,并計劃將其應(yīng)用于改進(jìn)旗下的大模型Llama。
DeepSeek-R1推理大模型于本月20日正式發(fā)布。據(jù)官方介紹,該模型在后訓(xùn)練階段大規(guī)模運(yùn)用了強(qiáng)化學(xué)習(xí)技術(shù),即便在標(biāo)注數(shù)據(jù)極少的情況下,也成功提升了模型的推理能力。在數(shù)學(xué)、代碼編寫和自然語言推理等任務(wù)上,DeepSeek-R1的性能與OpenAI的o1正式版不相上下。
Deepseek應(yīng)用在發(fā)布后迅速走紅,不僅在中國地區(qū)蘋果應(yīng)用商店免費(fèi)下載排行榜上登頂,還在美國地區(qū)超越了ChatGPT,成為下載量最高的免費(fèi)應(yīng)用。