近日,AI領(lǐng)域迎來了一位新晉明星——DeepSeek-R1模型。自昨晚開源以來,該模型迅速走紅,不僅在GitHub上的論文收藏量迅速突破5000大關(guān),還在YC黑客新聞、Reddit等多個(gè)平臺(tái)上引發(fā)了過萬(wàn)次的熱烈討論。DeepSeek-R1目前在Web和App端均可免費(fèi)使用,且模型完全開源,其多領(lǐng)域性能已與OpenAI的o1模型不相上下。
英偉達(dá)資深科學(xué)家、AI Agents業(yè)務(wù)負(fù)責(zé)人Jim Fan對(duì)DeepSeek-R1給予了高度評(píng)價(jià)。他指出,DeepSeek-R1不僅開源了大量的模型(包括正式版及六款蒸餾模型),還慷慨分享了所有的訓(xùn)練細(xì)節(jié)和方法。Jim Fan認(rèn)為,這可能是首個(gè)充分展示強(qiáng)化學(xué)習(xí)(RL)飛輪效應(yīng),并仍在持續(xù)增長(zhǎng)的開源項(xiàng)目。
在實(shí)際測(cè)試中,DeepSeek-R1展現(xiàn)出了驚人的能力。面對(duì)一道高考?jí)狠S題,它僅用80多秒就給出了正確答案,盡管求解過程與評(píng)分標(biāo)準(zhǔn)略有出入,但答案本身準(zhǔn)確無誤。更令人印象深刻的是,它能在9分鐘內(nèi)生成一段“開箱即用”的代碼,這段代碼渲染出的動(dòng)畫生動(dòng)地講解了量子力學(xué)的相關(guān)概念。DeepSeek-R1在文科領(lǐng)域同樣表現(xiàn)出色,能夠迅速回答腦筋急轉(zhuǎn)彎問題,并對(duì)古埃及、南非原住民歷史中的細(xì)節(jié)進(jìn)行詳盡分析。
與DeepSeek之前的版本V3相比,R1在推理能力上有了顯著提升。它的回答更為全面、詳實(shí),且論證充分。R1通常以結(jié)構(gòu)化的方式提供回答,并在思考和回答過程中補(bǔ)充大量背景信息,這些信息對(duì)用戶來說極具啟發(fā)性。據(jù)DeepSeek官方公布的數(shù)據(jù),R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的表現(xiàn)與OpenAI o1正式版不相上下。
DeepSeek-R1在大規(guī)模強(qiáng)化學(xué)習(xí)中自然涌現(xiàn)出了強(qiáng)大的推理能力和有趣的推理行為,且未進(jìn)行有監(jiān)督的微調(diào)(SFT)。然而,R1也并非無所不能。目前,它在通用性、多語(yǔ)言能力、提示工程和軟件工程能力等方面仍面臨挑戰(zhàn),導(dǎo)致在函數(shù)調(diào)用、復(fù)雜角色扮演等任務(wù)上的表現(xiàn)尚未達(dá)到預(yù)期水平。
盡管如此,DeepSeek-R1已經(jīng)吸引了大量用戶的關(guān)注和使用。用戶可以在DeepSeek官網(wǎng)與App上免費(fèi)體驗(yàn)這款模型,也可通過API接口以極低的價(jià)格(每百萬(wàn)tokens輸出僅需16元,相當(dāng)于OpenAI o1價(jià)格的3.7%)使用。DeepSeek采取了發(fā)布即上線的策略,讓用戶能夠第一時(shí)間體驗(yàn)到這款強(qiáng)大的模型。
在實(shí)際應(yīng)用中,DeepSeek-R1展現(xiàn)出了不俗的實(shí)力。在理科方面,它能夠迅速解答高考?jí)狠S題,并生成用于解釋量子力學(xué)概念的代碼動(dòng)畫。在文科方面,它的推理能力提升了信息的豐富度,能夠準(zhǔn)確回答腦筋急轉(zhuǎn)彎問題,并對(duì)歷史事件進(jìn)行詳盡分析。然而,R1在處理外文問題和某些特定提示詞時(shí)仍存在不足,需要進(jìn)一步優(yōu)化。
DeepSeek-R1的開源和免費(fèi)使用策略,無疑為全球AI開發(fā)者提供了寶貴的資源和機(jī)會(huì)。隨著更多用戶的加入和反饋,相信這款模型將會(huì)不斷得到優(yōu)化和完善,為AI領(lǐng)域的發(fā)展注入新的活力。