ITBear旗下自媒體矩陣:

DeepSeek再掀波瀾:新多模態(tài)模型Janus Pro挑戰(zhàn)AI極限?

   時(shí)間:2025-01-28 13:49:45 來源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

在AI技術(shù)日新月異的今天,一場由國內(nèi)新興AI企業(yè)引領(lǐng)的技術(shù)風(fēng)暴正悄然席卷全球。今年的春節(jié)假期前夕,一場沒有硝煙的戰(zhàn)爭在AI領(lǐng)域悄然打響,而主角并非傳統(tǒng)互聯(lián)網(wǎng)巨頭,而是名不見經(jīng)傳的“大模型公司”DeepSeek。

就在春節(jié)前一周,DeepSeek公司震撼發(fā)布了其推理模型DeepSeek-R1正式版。這款模型以低廉的訓(xùn)練成本,實(shí)現(xiàn)了與OpenAI頂尖推理模型相媲美的性能,并且完全免費(fèi)開源。此舉如同一顆重磅炸彈,瞬間在行業(yè)內(nèi)引發(fā)巨大轟動(dòng)。國產(chǎn)AI技術(shù)首次在全球范圍內(nèi),尤其是在美國科技圈,掀起了一場技術(shù)革命。

開發(fā)者們對(duì)DeepSeek的熱情空前高漲,紛紛表示正在考慮用DeepSeek來“重構(gòu)一切”。在這一波熱潮的推動(dòng)下,DeepSeek于一月剛剛發(fā)布的移動(dòng)端應(yīng)用,迅速攀升至美區(qū)蘋果應(yīng)用商店免費(fèi)App排行榜首位,不僅超越了ChatGPT,還力壓其他熱門應(yīng)用,成為市場焦點(diǎn)。

DeepSeek的成功甚至對(duì)美股市場產(chǎn)生了直接影響。其以低成本訓(xùn)練出高性能模型的事實(shí),迫使業(yè)界重新審視AI的訓(xùn)練路徑,導(dǎo)致AI第一股英偉達(dá)股價(jià)大幅波動(dòng),最大跌幅達(dá)到17%。

然而,DeepSeek的征程并未止步。就在除夕夜前一晚,該公司再次宣布開源其多模態(tài)模型Janus-Pro-7B,并在Geneval和DPG-Bench基準(zhǔn)測(cè)試中擊敗了來自O(shè)penAI的DALL-E 3和Stable Diffusion。這一連串的突破,讓DeepSeek成為了全球AI領(lǐng)域的焦點(diǎn)。

Janus-Pro系列模型是DeepSeek在技術(shù)創(chuàng)新上的又一力作。該模型采用了創(chuàng)新的架構(gòu),對(duì)理解(圖生文)和生成任務(wù)(文生圖)的視覺編碼進(jìn)行解耦,提升了模型訓(xùn)練的靈活性,有效解決了單一視覺編碼帶來的沖突和性能瓶頸。DeepSeek將這一模型命名為Janus(杰納斯),寓意模型能像古羅馬門神一樣,用不同的眼睛看待視覺數(shù)據(jù),分別編碼特征,然后用同一個(gè)Transformer處理這些輸入信號(hào)。

隨著Janus-Pro模型的發(fā)布,DeepSeek還推出了Janus Flow新型多模態(tài)AI框架,旨在統(tǒng)一圖像理解與生成任務(wù)。Janus-Pro模型能夠以簡短的提示提供更穩(wěn)定的輸出,具有更好的視覺質(zhì)量、更豐富的細(xì)節(jié)以及生成簡單文本的能力。它既能生成圖像,也能對(duì)圖片進(jìn)行描述、識(shí)別地標(biāo)景點(diǎn)、識(shí)別圖像中的文字,并能對(duì)圖片中的知識(shí)進(jìn)行介紹。

Janus-Pro模型在參數(shù)量上的探索也頗具意義。相較于DALL-E 3的120億參數(shù)量,Janus-Pro的大尺寸模型僅有70億參數(shù),卻能在緊湊的尺寸下實(shí)現(xiàn)卓越的效果。尤其是其1B模型,僅使用15億參數(shù),就已能在WebGPU上的瀏覽器中運(yùn)行,這一突破意味著圖片生成/圖片理解的成本正在進(jìn)一步降低。

DeepSeek的崛起,不僅攪動(dòng)了國內(nèi)的AI市場,更在全球范圍內(nèi)引發(fā)了廣泛關(guān)注。其以遠(yuǎn)低于美國大模型公司的成本,實(shí)現(xiàn)了技術(shù)創(chuàng)新和性能突破,讓美國同行倍感壓力。DeepSeek的創(chuàng)始人梁文峰甚至在社交媒體上發(fā)布了一張有趣的圖片,用土耳其射擊選手的梗來暗喻DeepSeek的“以小博大”。

面對(duì)DeepSeek的強(qiáng)勁勢(shì)頭,美國科技巨頭們也開始坐不住了。OpenAI的CEO Sam Altman也不得不站出來回應(yīng)這一波來自中國的技術(shù)沖擊??梢灶A(yù)見的是,2025年將是中國AI技術(shù)沖擊全球認(rèn)知的關(guān)鍵一年。

DeepSeek的連續(xù)突破,不僅展示了中國在AI領(lǐng)域的強(qiáng)大實(shí)力,更為全球AI技術(shù)的發(fā)展注入了新的活力。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,DeepSeek有望在全球AI市場中占據(jù)更加重要的地位。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭議稿件處理  |  English Version