滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

度小滿哈工大聯(lián)手，SmartTrim算法加速多模態(tài)金融應(yīng)用新篇章

時間：2024-11-18 12:25:55 來源：ITBEAR作者：砍柴網(wǎng)編輯：瑞雪 發(fā)表評論無障礙通道

【ITBEAR】近期，人工智能技術(shù)的迅猛發(fā)展使得多模態(tài)技術(shù)成為業(yè)界矚目的焦點。在這一背景下，度小滿憑借其在多模態(tài)領(lǐng)域的深厚積累，攜手哈爾濱工業(yè)大學(xué)，成功研發(fā)出一款名為SmartTrim的自適應(yīng)剪枝算法。

SmartTrim算法的出現(xiàn)，旨在解決視覺語言大模型（VLM）在研究和應(yīng)用中面臨的高計算成本問題。該算法通過智能分析模型中各層的token表示和attention head的冗余性，有效削減了多模態(tài)大模型中的冗余計算，從而實現(xiàn)了計算效率的顯著提升。相關(guān)研究成果已在國際自然語言處理領(lǐng)域的頂級會議COLING 24上發(fā)表。

在基于VQA微調(diào)的METER的跨模態(tài)編碼器中，層內(nèi)不同token和attention head表示的相似性示意圖

SmartTrim算法的核心在于其自適應(yīng)剪枝能力。該算法通過兩個關(guān)鍵組件——跨模態(tài)感知的Token修剪器和模態(tài)自適應(yīng)的注意力頭修剪器，實現(xiàn)了對模型中不必要計算負擔(dān)的智能識別與剪除。Token修剪器利用多層感知器（MLP）結(jié)構(gòu)，綜合考慮Token在單一模態(tài)序列中的獨立重要性及其在跨模態(tài)交互中的貢獻，智能地識別并去除那些對當前層不重要的Token。而注意力頭修剪器則直接集成在模型的自注意力模塊中，評估并修剪那些冗余的注意力頭，進一步優(yōu)化了模型的計算效率。

SmartTrim框架結(jié)構(gòu)圖

在訓(xùn)練SmartTrim模型時，研究人員采用了一種創(chuàng)新的雙重優(yōu)化策略，該策略結(jié)合了任務(wù)相關(guān)目標和計算開銷目標，通過重參數(shù)化技巧解決了不可導(dǎo)二值mask的問題，實現(xiàn)了模型的端到端訓(xùn)練。自蒸餾和課程學(xué)習(xí)策略的引入，進一步提高了剪枝后模型的性能，確保了訓(xùn)練過程的穩(wěn)定性和高效性。

Token的逐步裁剪修剪過程示意圖

實驗結(jié)果表明，SmartTrim算法在METER和BLIP兩個VLM上實現(xiàn)了2-3倍的加速效果，同時成功將性能損失降至最低。在1.5倍加速比下，SmartTrim的性能甚至超過了原始模型，展現(xiàn)出其在高加速比下的顯著優(yōu)勢。這一成果不僅為理論研究提供了新的視角，也為實際應(yīng)用中的模型優(yōu)化提供了切實可行的解決方案。

度小滿表示，SmartTrim技術(shù)的推出標志著多模態(tài)大模型研究邁出了重要的一步。未來，度小滿計劃將SmartTrim技術(shù)整合到公司的軒轅大模型中，以進一步提升大模型技術(shù)的性能和應(yīng)用效果。這一舉措將有望為金融領(lǐng)域帶來全新的變革和發(fā)展機遇。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

Redmi K80系列即將發(fā)布：影像大升級，性能強勁，價格或上漲？

11-18

文遠知行注冊資本增至30億，人工智能領(lǐng)域再添新勢力

11-18

豆神教育與智譜AI攜手成立新公司，涉足多項人工智能業(yè)務(wù)領(lǐng)域

11-18

海康睿影毫米波安檢儀，引領(lǐng)民航安檢新高度，獲A3頂級認證！

11-18

AI大佬齊聚知乎學(xué)術(shù)酒吧，共探AI未來新趨勢

11-18

GLM-4-Plus登頂兩大評測，國內(nèi)大模型實力再獲驗證！

11-18

尹世明履新谷歌云大中華區(qū)總裁，能否帶領(lǐng)谷歌云再創(chuàng)新高？

11-18

尹世明轉(zhuǎn)戰(zhàn)谷歌云，出任大中華區(qū)總裁，能否再創(chuàng)佳績？

11-18

天工大模型4.0 O1版將啟邀測，中文邏輯推理能力成亮點

11-18

3D互動新紀元！王詩沐千萬美元融資，全靈平臺引領(lǐng)AI社交潮流

11-18

一汽豐田bZ3C廣州車展炫酷登場，明年初上市搭載高階智駕系統(tǒng)

11-18

唯捷創(chuàng)芯股東會：聚焦主業(yè)投資，Q4芯片銷量展望樂觀

11-18

Kimi國產(chǎn)大模型k0-math發(fā)布，中考高考考研全勝，能否成數(shù)學(xué)解題新利器？

11-18

菲沃泰攜手魔形智能，探索AI大模型技術(shù)，共創(chuàng)新質(zhì)生產(chǎn)力新篇章

11-18

尹世明加盟谷歌云，出任大中華區(qū)總裁，能否帶領(lǐng)谷歌云在華實現(xiàn)突破？

11-18

點擊查看更多 +

全站最新

英特爾揭秘MRDIMM內(nèi)存：新技術(shù)助力峰值帶寬提升近40%

ThinkPad X1 Carbon Aura AI 2025預(yù)約開啟，輕盈強配OLED屏引期待！

小米SU7 Ultra車模搶購難，雷軍坦言：行業(yè)自動化不足致產(chǎn)能受限

OPPO Reno13蝶蝶紫開箱：這款“果味”新機究竟有多強？

印度Addverb公司擬2025年推人形機器人，劍指美歐市場

高通與聯(lián)發(fā)科旗艦芯片戰(zhàn)：誰才是市場真王者？

熱門內(nèi)容

本欄最新

?？殿Ｓ昂撩撞ò矙z儀，引領(lǐng)民航安檢新高度，獲A3頂級認證！

AI大佬齊聚知乎學(xué)術(shù)酒吧，共探AI未來新趨勢

GLM-4-Plus登頂兩大評測，國內(nèi)大模型實力再獲驗證！

尹世明履新谷歌云大中華區(qū)總裁，能否帶領(lǐng)谷歌云再創(chuàng)新高？

尹世明轉(zhuǎn)戰(zhàn)谷歌云，出任大中華區(qū)總裁，能否再創(chuàng)佳績？

3D互動新紀元！王詩沐千萬美元融資，全靈平臺引領(lǐng)AI社交潮流

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

度小滿哈工大聯(lián)手，SmartTrim算法加速多模態(tài)金融應(yīng)用新篇章

度小滿哈工大聯(lián)手，SmartTrim算法加速多模態(tài)金融應(yīng)用新篇章