滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

Hugging Face新推SmolVLM多模態(tài)模型：高效能低資源新選擇

時(shí)間：2025-01-27 07:56:32 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

近日，科技界迎來了一項(xiàng)新的突破，Hugging Face公司于1月26日正式推出了兩款精心打造的多模態(tài)模型——SmolVLM-256M與SmolVLM-500M。這兩款模型是從去年訓(xùn)練的龐大800億參數(shù)模型中提煉而出，成功地在性能與資源消耗之間找到了完美的平衡點(diǎn)。

據(jù)悉，SmolVLM-256M采用了先進(jìn)的SigLIP作為圖像編碼技術(shù)，而更高級(jí)別的SmolVLM-500M則配備了更為強(qiáng)大的SmolLM2文本編碼器。尤為引人注目的是，SmolVLM-256M憑借其小巧的體積，成功躋身當(dāng)前最小的多模態(tài)模型之列。它不僅能夠接收任意序列的圖像與文本輸入，還能生成豐富的文字輸出，涵蓋圖片描述、視頻字幕生成乃至PDF處理等多樣化功能。

在資源占用方面，這兩款模型同樣展現(xiàn)出了極高的效率。對(duì)于移動(dòng)設(shè)備而言，SmolVLM-256M僅需不到1GB的GPU顯存即可完成單張圖片的推理任務(wù)，這對(duì)于移動(dòng)應(yīng)用開發(fā)來說無疑是個(gè)巨大的福音。而對(duì)于追求更高性能的企業(yè)級(jí)應(yīng)用環(huán)境，SmolVLM-500M則提供了更為精準(zhǔn)的輸出結(jié)果，盡管其資源需求稍高，僅需1.23GB的GPU顯存，但其在處理復(fù)雜任務(wù)時(shí)的表現(xiàn)更為出色。

值得注意的是，Hugging Face此次推出的兩款模型均采用了Apache 2.0開源授權(quán)，這意味著開發(fā)者可以自由地獲取、修改和分發(fā)這些模型。公司還貼心地提供了基于transformer和WebGUI的示例程序，大大降低了開發(fā)者的上手難度。所有模型及其演示代碼均已在公開平臺(tái)上發(fā)布，方便開發(fā)者下載與使用。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

賽力斯集團(tuán)攜手北航，共啟新興產(chǎn)業(yè)產(chǎn)學(xué)研用新篇章！

01-27

賽力斯集團(tuán)攜手北航，開啟校企合作新篇章！

01-27

倫敦?cái)z政公園“白宮”易主，美國科技億萬富豪1.39億英鎊豪擲購入

01-27

張大大霸凌風(fēng)波再起，直播劇本泛濫，MCN員工權(quán)益何以保障？

留幾手也曾吐槽過張大大直播，稱張大大簽約的MCN是無憂傳媒，批量流水線人工打造人設(shè)，背后有劇本，都是套路打造出來人設(shè)。據(jù)九派新聞報(bào)道，1月26日，一位無憂傳媒前員工表示：無憂的張大大工作室已經(jīng)換了好幾波員…

01-27

冷鏈物流市場規(guī)模持續(xù)擴(kuò)大！企查查：超四成企業(yè)成立5-10年

01-27

動(dòng)保企業(yè)業(yè)績寒冬，寵物市場成新希望？

01-27

證監(jiān)會(huì)力推資本市場指數(shù)化投資高質(zhì)量發(fā)展新方案

01-27

倫敦?cái)z政公園“白宮”易主，美國科技億萬富豪1.39億英鎊豪擲購入

01-26

比爾·蓋茨自傳曝心聲：離婚成最大遺憾，27年婚姻何以至此？

01-26

Mudra Link追蹤腕帶：VR新體驗(yàn)，手指動(dòng)作精準(zhǔn)捕捉無壓力

01-26

智譜AI高層變動(dòng)：兩位元老離職，前Midjourney高管入局能否破局？

之所以會(huì)邀請(qǐng)運(yùn)營側(cè)精英加入，主要是因?yàn)橹亲V的ChatBot產(chǎn)品相比于kimi和豆包并不占優(yōu)，而其也想要通過一條AI Agent的道路破局，自去年10月，智譜連續(xù)發(fā)布AutoGLM和PC端的AutoGLM，雖…

01-26

抖音副總裁李亮論短劇：精品化是方向，尊重老人娛樂選擇

01-26

抖音副總裁李亮：短劇應(yīng)走精品路，老年人看劇權(quán)利應(yīng)尊重

他還指出短劇發(fā)展的早期，一些長劇平臺(tái)錯(cuò)過了最初增長窗口，在用戶和營收上有些壓力，現(xiàn)在也開始做短劇。最后，關(guān)于老年人看短劇，他個(gè)人觀點(diǎn)是，只要不是大量占用老年人戶外運(yùn)動(dòng)時(shí)間，不沉迷、不過度消費(fèi)，應(yīng)該尊重他們…

01-26

浙商銀行子公司浙銀理財(cái)獲批開業(yè)，注冊(cè)資本高達(dá)20億

01-26

歐盟完成對(duì)X平臺(tái)調(diào)查，馬斯克或?qū)⒚媾R數(shù)億歐元罰款？

01-26

點(diǎn)擊查看更多 +

全站最新

賽力斯集團(tuán)攜手北航，開啟校企合作新篇章！

蘋果iOS 18.4四月更新：Siri更智能，Apple Intelligence將支持中文

蘋果iCloud+存儲(chǔ)方案遭吐槽：200GB至2TB跨度大，用戶呼喚更靈活選擇

《黑色沙漠》手游國服將停運(yùn)，騰訊代理協(xié)議到期引關(guān)注

DeepSeek火爆，哪些ETF將受益或受沖擊？

游戲?yàn)槊剑蚴澜缰v述中國故事！

熱門內(nèi)容

本欄最新

倫敦?cái)z政公園“白宮”易主，美國科技億萬富豪1.39億英鎊豪擲購入

張大大霸凌風(fēng)波再起，直播劇本泛濫，MCN員工權(quán)益何以保障？

冷鏈物流市場規(guī)模持續(xù)擴(kuò)大！企查查：超四成企業(yè)成立5-10年

動(dòng)保企業(yè)業(yè)績寒冬，寵物市場成新希望？

證監(jiān)會(huì)力推資本市場指數(shù)化投資高質(zhì)量發(fā)展新方案

倫敦?cái)z政公園“白宮”易主，美國科技億萬富豪1.39億英鎊豪擲購入

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.