【ITBEAR】近日,Mistral AI 公司正式揭曉了其最新的多模態(tài)人工智能模型——Pixtral Large。這一模型在11月18日的官方公告中首次亮相,憑借1240億參數(shù)的龐大體量,專為文本與圖像的處理任務(wù)而設(shè)計。
Pixtral Large 目前已面向研究、教育及商業(yè)領(lǐng)域開放,用戶可通過Mistral提供的研究許可證和商業(yè)許可證進行訪問和使用。這一舉措無疑為各領(lǐng)域的研究者和實踐者提供了強大的工具支持。
作為Mistral AI多模態(tài)模型家族的新成員,Pixtral Large在多個標準基準測試中展現(xiàn)出了卓越的性能。特別是在MathVista測試中,Pixtral Large以69.4%的準確率脫穎而出,超越了所有同行競爭對手,彰顯了其在復(fù)雜數(shù)學(xué)問題解決方面的優(yōu)勢。
不僅如此,Pixtral Large在ChartQA和DocVQA等測試中同樣表現(xiàn)出色,超越了GPT-4o和Gemini-1.5 Pro等業(yè)界知名模型。這些測試結(jié)果進一步證明了Pixtral Large在處理圖表、文檔及視覺問答等任務(wù)時的強大能力。
Pixtral Large的技術(shù)架構(gòu)同樣令人矚目。該模型配備了123B的多模態(tài)解碼器和1B的視覺編碼器,支持高達128K的上下文窗口,能夠輕松處理至少30張高分辨率圖像。這一設(shè)計使得Pixtral Large在處理視覺數(shù)據(jù)、復(fù)雜推理以及圖表理解等方面均展現(xiàn)出了非凡的實力。
隨著Pixtral Large的推出,Mistral AI進一步鞏固了其在多模態(tài)人工智能領(lǐng)域的領(lǐng)先地位。這一創(chuàng)新成果不僅為研究者提供了強大的工具支持,也為商業(yè)應(yīng)用開辟了更加廣闊的前景。