ITBear旗下自媒體矩陣:

DeepSeek凌晨發(fā)布Janus-Pro,多模態(tài)大模型性能超越OpenAI DALL-E 3

   時間:2025-01-28 10:51:25 來源:ITBEAR編輯:快訊團(tuán)隊 發(fā)表評論無障礙通道

國產(chǎn)大模型DeepSeek在科技界再度掀起波瀾,于1月28日凌晨悄然發(fā)布其最新力作——Janus-Pro多模態(tài)大模型,正式涉足文本生成圖像領(lǐng)域。這一舉動不僅彰顯了DeepSeek在人工智能領(lǐng)域的深厚底蘊(yùn),更為全球AI技術(shù)競賽增添了新的看點(diǎn)。

在備受矚目的Geneval和DPG-Bench基準(zhǔn)測試中,Janus-Pro-7B憑借其卓越性能,一舉超越了OpenAI的DALL-E 3、Stable Diffusion以及Emu3-Gen等業(yè)界知名模型,展現(xiàn)了其強(qiáng)大的文本到圖像生成能力。這一成就無疑為DeepSeek贏得了更多的關(guān)注與贊譽(yù)。

據(jù)DeepSeek方面介紹,Janus-Pro作為其此前發(fā)布的JanusFlow大模型的高級版本,在訓(xùn)練策略、訓(xùn)練數(shù)據(jù)以及模型規(guī)模等方面均進(jìn)行了全面優(yōu)化與升級。這些改進(jìn)使得Janus-Pro在多模態(tài)理解和文本到圖像的指令跟蹤功能方面取得了顯著進(jìn)步,同時大幅提升了文本到圖像生成的穩(wěn)定性。

盡管目前Janus-Pro僅能處理384x384分辨率的圖像,但其緊湊的模型結(jié)構(gòu)卻能實現(xiàn)如此高水平的性能,實屬難能可貴。這一特點(diǎn)使得Janus-Pro在資源受限的環(huán)境下仍能保持出色的表現(xiàn),為更多應(yīng)用場景提供了可能。

作為一款多模態(tài)模型,Janus-Pro的功能遠(yuǎn)不止于文本生成圖像。它還能對圖片進(jìn)行精準(zhǔn)描述,識別地標(biāo)景點(diǎn),識別圖像中的文字,并能對圖片中的知識進(jìn)行詳細(xì)介紹。這些功能使得Janus-Pro在圖像處理、信息檢索以及知識問答等領(lǐng)域具有廣泛的應(yīng)用前景。

Janus-Pro采用了MIT開源協(xié)議,這意味著用戶可以無限制地將其應(yīng)用于商業(yè)場景。這一舉措無疑將進(jìn)一步推動Janus-Pro的普及與應(yīng)用,為更多企業(yè)和個人提供強(qiáng)大的AI技術(shù)支持。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version