滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

DeepSeek-R1實(shí)測(cè)：高考題秒解，文科也拿手，但仍面臨四大挑戰(zhàn)

時(shí)間：2025-01-21 19:39:09 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

近日，AI領(lǐng)域迎來了一位新晉明星——DeepSeek-R1模型。自昨晚開源以來，該模型迅速走紅，不僅在GitHub上的論文收藏量迅速突破5000大關(guān)，還在YC黑客新聞、Reddit等多個(gè)平臺(tái)上引發(fā)了過萬(wàn)次的熱烈討論。DeepSeek-R1目前在Web和App端均可免費(fèi)使用，且模型完全開源，其多領(lǐng)域性能已與OpenAI的o1模型不相上下。

英偉達(dá)資深科學(xué)家、AI Agents業(yè)務(wù)負(fù)責(zé)人Jim Fan對(duì)DeepSeek-R1給予了高度評(píng)價(jià)。他指出，DeepSeek-R1不僅開源了大量的模型（包括正式版及六款蒸餾模型），還慷慨分享了所有的訓(xùn)練細(xì)節(jié)和方法。Jim Fan認(rèn)為，這可能是首個(gè)充分展示強(qiáng)化學(xué)習(xí)（RL）飛輪效應(yīng)，并仍在持續(xù)增長(zhǎng)的開源項(xiàng)目。

在實(shí)際測(cè)試中，DeepSeek-R1展現(xiàn)出了驚人的能力。面對(duì)一道高考?jí)狠S題，它僅用80多秒就給出了正確答案，盡管求解過程與評(píng)分標(biāo)準(zhǔn)略有出入，但答案本身準(zhǔn)確無誤。更令人印象深刻的是，它能在9分鐘內(nèi)生成一段“開箱即用”的代碼，這段代碼渲染出的動(dòng)畫生動(dòng)地講解了量子力學(xué)的相關(guān)概念。DeepSeek-R1在文科領(lǐng)域同樣表現(xiàn)出色，能夠迅速回答腦筋急轉(zhuǎn)彎問題，并對(duì)古埃及、南非原住民歷史中的細(xì)節(jié)進(jìn)行詳盡分析。

與DeepSeek之前的版本V3相比，R1在推理能力上有了顯著提升。它的回答更為全面、詳實(shí)，且論證充分。R1通常以結(jié)構(gòu)化的方式提供回答，并在思考和回答過程中補(bǔ)充大量背景信息，這些信息對(duì)用戶來說極具啟發(fā)性。據(jù)DeepSeek官方公布的數(shù)據(jù)，R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的表現(xiàn)與OpenAI o1正式版不相上下。

DeepSeek-R1在大規(guī)模強(qiáng)化學(xué)習(xí)中自然涌現(xiàn)出了強(qiáng)大的推理能力和有趣的推理行為，且未進(jìn)行有監(jiān)督的微調(diào)（SFT）。然而，R1也并非無所不能。目前，它在通用性、多語(yǔ)言能力、提示工程和軟件工程能力等方面仍面臨挑戰(zhàn)，導(dǎo)致在函數(shù)調(diào)用、復(fù)雜角色扮演等任務(wù)上的表現(xiàn)尚未達(dá)到預(yù)期水平。

盡管如此，DeepSeek-R1已經(jīng)吸引了大量用戶的關(guān)注和使用。用戶可以在DeepSeek官網(wǎng)與App上免費(fèi)體驗(yàn)這款模型，也可通過API接口以極低的價(jià)格（每百萬(wàn)tokens輸出僅需16元，相當(dāng)于OpenAI o1價(jià)格的3.7%）使用。DeepSeek采取了發(fā)布即上線的策略，讓用戶能夠第一時(shí)間體驗(yàn)到這款強(qiáng)大的模型。

在實(shí)際應(yīng)用中，DeepSeek-R1展現(xiàn)出了不俗的實(shí)力。在理科方面，它能夠迅速解答高考?jí)狠S題，并生成用于解釋量子力學(xué)概念的代碼動(dòng)畫。在文科方面，它的推理能力提升了信息的豐富度，能夠準(zhǔn)確回答腦筋急轉(zhuǎn)彎問題，并對(duì)歷史事件進(jìn)行詳盡分析。然而，R1在處理外文問題和某些特定提示詞時(shí)仍存在不足，需要進(jìn)一步優(yōu)化。

DeepSeek-R1的開源和免費(fèi)使用策略，無疑為全球AI開發(fā)者提供了寶貴的資源和機(jī)會(huì)。隨著更多用戶的加入和反饋，相信這款模型將會(huì)不斷得到優(yōu)化和完善，為AI領(lǐng)域的發(fā)展注入新的活力。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

三言科技1月21日消息，今日，餓了么公布九項(xiàng)加強(qiáng)騎手權(quán)益舉措，包括落實(shí)算法公開常態(tài)化、建立更廣泛算法溝通機(jī)制等。餓了么在平臺(tái)官網(wǎng)設(shè)立算法公示專欄，及時(shí)與社會(huì)公眾溝通餓了么的算法原則與優(yōu)化進(jìn)程。餓了么將通過持續(xù)…

01-21

新東方財(cái)報(bào)亮點(diǎn)：?jiǎn)渭緺I(yíng)收增近兩成，新業(yè)務(wù)帶動(dòng)增長(zhǎng)但運(yùn)營(yíng)利潤(rùn)下滑

01-21

Intel銳炫B570顯卡上市即降價(jià)，德國(guó)市場(chǎng)首現(xiàn)9折優(yōu)惠！

01-21

魅族PANDAER發(fā)布BUBU特別款鍵帽，3D金屬設(shè)計(jì)限量200顆售99元

01-21

2025春運(yùn)自駕成主流，你加入80%的歸家大軍了嗎？

01-21

AMD RX 9070顯卡因定價(jià)過高遭推遲，已發(fā)貨顯卡如何處理成難題

01-21

2025年春節(jié)檔預(yù)售火爆！《射雕英雄傳》領(lǐng)跑，哪吒唐探封神緊追其后

01-21

我國(guó)量子科技突破！全球首套±800kV特高壓直流量子電流傳感器問世

01-21

機(jī)器人外骨骼手，讓鋼琴家技能躍升新高度？

01-21

寒武紀(jì)前CTO梁軍索賠42.9億：股權(quán)激勵(lì)爭(zhēng)議升級(jí)法庭見

請(qǐng)求法院裁定其與中科寒武紀(jì)2017年10月18日至2022年2月10日存在勞動(dòng)關(guān)系，請(qǐng)求中科寒武紀(jì)賠償自己股權(quán)激勵(lì)損失4,286,624,448元，目前該案正等待審理。梁軍解釋稱，上述42.9億元的單價(jià)是根…

01-21

鄉(xiāng)村孩子提問，6000大學(xué)生騰訊頻道暖心“一分鐘支教”

01-21

凌雄科技再獲國(guó)家級(jí)專精特新“小巨人”，DaaS服務(wù)引領(lǐng)行業(yè)高質(zhì)量發(fā)展

01-21

榮耀高管變動(dòng)后，首席影像工程師羅巍誓言：影像不崛起，不離崗！

01-21

青云科技KubeSphere企業(yè)版榮登CSDN 2024年度創(chuàng)新榜單，云原生實(shí)力再獲認(rèn)可！

01-21

餓了么九項(xiàng)新舉措力挺騎手：透明算法，守護(hù)安全，共筑友好未來

01-21

點(diǎn)擊查看更多 +

全站最新

小米汽車YU7新照泄露：掀背尾門配隱藏門把手，設(shè)計(jì)感十足！

尊界S800外觀設(shè)計(jì)大揭秘，能否成功沖擊超豪華市場(chǎng)？

第九大行星或?qū)F(xiàn)身？新研究稱其十年內(nèi)有望被發(fā)現(xiàn)

禾賽科技激光雷達(dá)賦能奇瑞新車，2025年量產(chǎn)，性能大升級(jí)！

新東方財(cái)報(bào)亮點(diǎn)：?jiǎn)渭緺I(yíng)收增近兩成，新業(yè)務(wù)帶動(dòng)增長(zhǎng)但運(yùn)營(yíng)利潤(rùn)下滑

華為nova 13系列新春大促，影像顏值雙全，年輕人的換機(jī)首選！

熱門內(nèi)容

本欄最新

新東方財(cái)報(bào)亮點(diǎn)：?jiǎn)渭緺I(yíng)收增近兩成，新業(yè)務(wù)帶動(dòng)增長(zhǎng)但運(yùn)營(yíng)利潤(rùn)下滑

Intel銳炫B570顯卡上市即降價(jià)，德國(guó)市場(chǎng)首現(xiàn)9折優(yōu)惠！

魅族PANDAER發(fā)布BUBU特別款鍵帽，3D金屬設(shè)計(jì)限量200顆售99元

2025春運(yùn)自駕成主流，你加入80%的歸家大軍了嗎？

AMD RX 9070顯卡因定價(jià)過高遭推遲，已發(fā)貨顯卡如何處理成難題

2025年春節(jié)檔預(yù)售火爆！《射雕英雄傳》領(lǐng)跑，哪吒唐探封神緊追其后

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

DeepSeek-R1實(shí)測(cè)：高考題秒解，文科也拿手，但仍面臨四大挑戰(zhàn)

DeepSeek-R1實(shí)測(cè)：高考題秒解，文科也拿手，但仍面臨四大挑戰(zhàn)