中國大模型公司提出新架構(gòu)，解決Context無限長(zhǎng)問題，開啟Agent時(shí)代

時(shí)間：2025-01-16 21:15:30 來源：ITBEAR編輯：汪淼 發(fā)表評(píng)論無障礙通道

日月開新元，萬象啟新篇。

1月15日，MiniMax發(fā)布并開源新一代01系列模型，包含基礎(chǔ)語言大模型 MiniMax-Text-01 和視覺多模態(tài)大模型MiniMax-VL-01。該系列模型使用多項(xiàng)突破性創(chuàng)新，以大規(guī)模應(yīng)用線性注意力機(jī)制打破Transformer傳統(tǒng)架構(gòu)記憶瓶頸，在綜合性能比肩GPT-4o、Claude-3.5等海外領(lǐng)軍模型的基礎(chǔ)上，能夠高效處理高達(dá)400萬token的輸入，可輸入長(zhǎng)度是GPT-4o的32倍，Claude-3.5-Sonnet的20倍。

目前，MiniMax-01系列開源模型已應(yīng)用于MiniMax旗下產(chǎn)品海螺AI并在全球上線，企業(yè)與個(gè)人開發(fā)者可前往MiniMax開放平臺(tái)使用API。

以架構(gòu)創(chuàng)新實(shí)現(xiàn)高效超長(zhǎng)文本輸入

2017年，具有里程碑意義的論文《Attention Is All You Need》正式發(fā)表，Transformer架構(gòu)問世并逐步發(fā)展成為該領(lǐng)域的主流技術(shù)范式。自2023年起，自然語言處理領(lǐng)域迎來了一股創(chuàng)新浪潮，對(duì)模型架構(gòu)的創(chuàng)新需求日益增加。

MiniMax-01系列模型首次將線性注意力機(jī)制擴(kuò)展到商用模型的級(jí)別，并使其綜合能力達(dá)到全球第一梯隊(duì)。而受益于此次架構(gòu)創(chuàng)新，該系列模型在處理長(zhǎng)輸入的時(shí)候具有非常高的效率，接近線性復(fù)雜度。從Scaling Law、與MoE的結(jié)合、結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練優(yōu)化和推理優(yōu)化等層面綜合考慮，MiniMax選擇模型參數(shù)量為4560億，其中每次激活459億，能夠高效處理高達(dá)400萬token的上下文，將有效替代Transformer傳統(tǒng)架構(gòu)并開啟超長(zhǎng)文本輸入時(shí)代。

MiniMax-01模型發(fā)布后，在國內(nèi)外迅速掀起了熱議浪潮。海外媒體與AI從業(yè)者聚焦該模型，深入探討其技術(shù)內(nèi)涵與潛在價(jià)值，對(duì)其所展現(xiàn)出的創(chuàng)新性給予了高度肯定。

性能比肩國際領(lǐng)軍模型

在應(yīng)用創(chuàng)新架構(gòu)之外，MiniMax大規(guī)模重構(gòu)了01系列模型的訓(xùn)練和推理系統(tǒng)，包括更高效的MoE All-to-all通訊優(yōu)化、更長(zhǎng)的序列的優(yōu)化，以及推線性注意力層的高效Kernel實(shí)現(xiàn)，使得模型能力可與全球頂級(jí)閉源模型相媲美。

在業(yè)界主流的文本和多模態(tài)理解任務(wù)處理表現(xiàn)上，MiniMax-01系列模型大多情況下可以追平海外公認(rèn)最先進(jìn)的兩個(gè)模型，GPT-4o-1120以及Claude-3.5-sonnet-1022。過往的模型能力評(píng)測(cè)中，Google的自研模型Gemini有著顯著的長(zhǎng)文優(yōu)勢(shì)。而在01系列模型參評(píng)的長(zhǎng)文任務(wù)下，相較于Gemini等一眾全球頂級(jí)模型，MiniMax-01隨著輸入長(zhǎng)度變長(zhǎng)，性能衰減最慢，效果及其出眾。

▲ 多項(xiàng)任務(wù)評(píng)測(cè)結(jié)果顯示，MiniMax-01系列模型核心性能穩(wěn)居全球第一梯隊(duì)。（圖源MiniMax-01系列模型技術(shù)報(bào)告）

▲ MiniMax-01系列模型長(zhǎng)上下文處理能力全球領(lǐng)先。（圖源MiniMax-01系列模型技術(shù)報(bào)告）

加速AI Agent時(shí)代到來

2025年，AI將迎來至關(guān)重要的發(fā)展節(jié)點(diǎn)，AI Agent有望成為新一年最重要的產(chǎn)品形態(tài)，引領(lǐng)AI從傳統(tǒng)的“工具”角色向更具互動(dòng)性與協(xié)作性的“伙伴”角色轉(zhuǎn)變。AI Agent時(shí)代，由于智能體處理的任務(wù)變得越來越復(fù)雜，涉及的數(shù)據(jù)量也越來越大，單個(gè)智能體的記憶以及多個(gè)智能體協(xié)作間的上下文都會(huì)變得越來越長(zhǎng)。因此，長(zhǎng)上下文能力與多模態(tài)處理能力的提升，是AI Agent為各行業(yè)帶來更為豐富、高效、智能的解決方案的必要條件。

MiniMax在Github上開源了Text-01模型、VL-01模型的完整權(quán)重，以便于更多開發(fā)者做有價(jià)值、突破性的研究。MiniMax表示，“我們認(rèn)為這有可能啟發(fā)更多長(zhǎng)上下文的研究和應(yīng)用，從而更快促進(jìn)Agent時(shí)代的到來，二是開源也能促使我們努力做更多創(chuàng)新，更高質(zhì)量地開展后續(xù)的模型研發(fā)工作?！?/p>

憑借開放、共享、協(xié)作的特點(diǎn)，開源模型激發(fā)AI產(chǎn)業(yè)的創(chuàng)新活力，正在成為賦能新質(zhì)生產(chǎn)力發(fā)展的關(guān)鍵引擎。受益于Linear Attention層面的架構(gòu)創(chuàng)新、算力層面的優(yōu)化，以及集群上的訓(xùn)推一體的設(shè)計(jì)，MiniMax以業(yè)內(nèi)極具性價(jià)比的價(jià)格提供文本模型和多模態(tài)理解模型的API服務(wù)，標(biāo)準(zhǔn)定價(jià)是輸入token 1元/百萬token，輸出token 8元/百萬token。

論文鏈接：https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf

半導(dǎo)體封裝測(cè)試解決方案專業(yè)品牌蔚華科技(TWSE: 3055)與經(jīng)銷合作伙伴恩艾(艾默生/NI)宣布將共同建置亞太區(qū)首座功率半導(dǎo)體動(dòng)態(tài)可靠度驗(yàn)證實(shí)驗(yàn)室，瞄準(zhǔn)亞太地區(qū)功率半導(dǎo)體芯片在車規(guī)驗(yàn)證的需求，為亞太地區(qū)半導(dǎo)體制造業(yè)客戶就近提供驗(yàn)證服務(wù)，加速客戶研發(fā)及生產(chǎn)制造的進(jìn)

距離蛇年春節(jié)越來越近，大街小巷為了迎接新年開啟了各式各樣的裝扮。每到新年，準(zhǔn)備年貨自然是必不可少的環(huán)節(jié)。隨著時(shí)代的發(fā)展變化，年貨可選擇的范圍也越來越大，品類也越來越豐富。除了常規(guī)的吃穿品類選擇，手機(jī)這樣的科技產(chǎn)物，也成為了不少人年貨購物清單的一分子。

很多年輕人的家庭已經(jīng)放棄了電視這個(gè)選項(xiàng)，在客廳里放上了投影儀，而且也有越來越多人用投影玩起了游戲，今天就給大家深度解析一下投影儀可以用來打游戲嗎?投影儀可以連Switch/PS5嗎?游戲投影儀到底是不是智商稅?2025年游戲投影儀怎么選?順便做個(gè)2025年游戲投影儀推薦，

1月12日，2025亞太掠奪者電競(jìng)大賽在陣陣高燃對(duì)決中迎來圓滿落幕，在擊敗來自14個(gè)地區(qū)的頂級(jí)隊(duì)伍后，Alter Ego(無畏契約)和Myth Avenue Gaming(Dota 2)戰(zhàn)隊(duì)脫穎而出，成為2025亞太掠奪者電競(jìng)大賽的冠軍。兩支戰(zhàn)隊(duì)在第六屆掠奪者電競(jìng)大賽中奪得了備受向往的掠奪者盾牌，并

近日，全球零售解決方案商SHOPLINE與商品定制解決方案提供商CustoMeow宣布達(dá)成戰(zhàn)略合作，推出一站式商品定制解決方案。該方案集成了SHEIN、Soufeel等行業(yè)頭部大賣的商品定制最佳實(shí)踐，幫助商家高效應(yīng)對(duì)定制化商品的復(fù)雜流程，實(shí)現(xiàn)業(yè)務(wù)增長(zhǎng)。一、深度融合行業(yè)技術(shù)與經(jīng)驗(yàn)

近日，CES 2025官方獎(jiǎng)項(xiàng)公布，TCL榮獲多項(xiàng)大獎(jiǎng)。其中，TCL QD-Mini LED TV X11K榮獲“Mini LED顯示技術(shù)創(chuàng)新獎(jiǎng)”，TCL小藍(lán)翼新風(fēng)系列空調(diào)榮獲“智慧新風(fēng)技術(shù)創(chuàng)新獎(jiǎng)”，TCL超級(jí)筒滾筒洗衣機(jī)榮獲“潔凈技術(shù)創(chuàng)新金獎(jiǎng)”。此外，TCL還入選了2024-2025年度消費(fèi)電子領(lǐng)先品牌TOP1

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

中國大模型公司提出新架構(gòu)，解決Context無限長(zhǎng)問題，開啟Agent時(shí)代

中國大模型公司提出新架構(gòu)，解決Context無限長(zhǎng)問題，開啟Agent時(shí)代