在CES 2025盛會上,NVIDIA宣布了一項重大突破,為PC開發(fā)者和發(fā)燒友帶來全新的AI體驗。該公司推出了NVIDIA NIM?微服務和AI Blueprint,旨在幫助用戶在個人電腦上構(gòu)建AI智能體和創(chuàng)意工作流。
NVIDIA此次發(fā)布的亮點之一,是其能夠在NVIDIA RTX? AI PC上本地運行的基礎模型。這些模型通過全新GeForce RTX? 50系列GPU加速,提供高達2375 AI TOPS和32GB顯存的強勁性能。RTX 50系列GPU基于NVIDIA Blackwell架構(gòu),是首批支持FP4計算精度的消費級GPU。與前代產(chǎn)品相比,其AI推理性能提升了2倍,使得生成式AI模型能夠以更小的顯存占用空間在本地運行。
長期以來,GeForce?一直是AI開發(fā)者的得力助手。早在2012年,首個由GPU加速的深度學習網(wǎng)絡AlexNet就是在GeForce GTX 580上訓練的。而在去年的AI研究論文中,超過30%都提及了對GeForce RTX的使用?,F(xiàn)在,借助生成式AI和RTX AI PC,任何人都有機會成為開發(fā)者。
NVIDIA NIM微服務通過簡單的圖形用戶界面(GUI),使得獲取和部署最新的生成式AI模型變得輕而易舉。借助新一代低代碼和無代碼工具,如AnythingLLM、ComfyUI和LangFlow,發(fā)燒友可以在復雜的工作流中輕松使用AI模型。這些微服務為數(shù)字人、內(nèi)容創(chuàng)作等應用提供了易于使用的預配置參考工作流。
NVIDIA還宣布了一系列來自頂尖模型開發(fā)者的適用于RTX AI PC的NIM微服務,包括Black Forest Labs、meta、Mistral和Stability AI等。這些服務涵蓋了從大語言模型(LLM)到視覺語言模型、圖像生成、語音、檢索增強生成(RAG)的嵌入模型、PDF提取和計算機視覺等多個應用場景。
Black Forest Labs的首席執(zhí)行官Robin Rombach表示:“支持FP4計算精度的GeForce RTX 50系列GPU,將使一大批此前僅適用于大型數(shù)據(jù)中心的模型得以在PC上運行。通過將Flux打造成NVIDIA NIM微服務,我們可以讓更多的用戶以更快的速度部署和體驗AI,同時提供超乎想象的性能?!?/p>
NVIDIA還推出了Llama Nemotron,這是一系列開放許可的基礎模型,能夠在各類代理式任務中提供極高的精度。Llama Nemotron Nano模型將作為面向RTX AI PC和工作站的NIM微服務提供,在指令遵循、工具調(diào)用、聊天、代碼和數(shù)學等代理式AI任務方面表現(xiàn)出色。
微軟副總裁、Windows業(yè)務負責人Pavan Davuluri也對此表示支持:“AI正在快速驅(qū)動Windows 11 PC的創(chuàng)新,適用于Linux的Windows子系統(tǒng)(WSL)和Windows Copilot Runtime為Windows 11上的AI開發(fā)提供了出色的跨平臺環(huán)境。NVIDIA NIM微服務為Windows PC提供優(yōu)化,為開發(fā)者和發(fā)燒友提供了可立即集成到其Windows應用中的AI模型,從而進一步加速了Windows用戶的AI功能部署。”
運行在RTX AI PC上的NIM微服務將兼容先進的AI開發(fā)和智能體框架,包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、LangFlow和LM Studio等。開發(fā)者可以通過行業(yè)標準端點,將基于這些框架構(gòu)建的應用和工作流連接到運行NIM微服務的AI模型,無論在云端、數(shù)據(jù)中心、工作站還是PC上,都可以通過統(tǒng)一的接口使用最新技術(shù)。
為了向RTX發(fā)燒友和開發(fā)者展示使用NIM微服務構(gòu)建AI智能體和助手的方法,NVIDIA首次公開了Project R2X。這是一款具有視覺能力的PC虛擬形象,可以讓用戶需要的信息觸手可及,協(xié)助用戶使用桌面應用、進行視頻會議、閱讀和總結(jié)文檔等。該虛擬形象采用全新生成式AI算法NVIDIA RTX Neural Faces渲染而成,并通過基于擴散原理的全新NVIDIA Audio2Face?-3D模型驅(qū)動動畫。
NVIDIA NIM微服務和AI Blueprint將從2月起開始提供,首發(fā)支持的硬件包括GeForce RTX 50系列、GeForce RTX 4090和4080以及NVIDIA RTX 6000和5000 GPU。未來,還將陸續(xù)提供對其他GPU的支持。宏碁、華碩、戴爾、惠普、聯(lián)想、微星和雷蛇將推出支持NIM的RTX AI PC。