【ITBEAR】近期發(fā)售不少游戲大作,而通過(guò)我們此前的實(shí)機(jī)測(cè)試來(lái)看,70級(jí)顯卡即可完美駕馭,其中又以后來(lái)發(fā)布的SUPER系列性價(jià)比最高。那么今天給大家?guī)?lái)的則是耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡的評(píng)測(cè)。
踏雪Mini是目前耕升踏雪系列針對(duì)雙風(fēng)扇小尺寸顯卡推出的型號(hào),整體的設(shè)計(jì)語(yǔ)言與三風(fēng)扇踏雪基本相同,但相對(duì)更圓潤(rùn)一些,非常符合ITX小巧迷你的設(shè)計(jì)初衷。
下面就讓我們來(lái)一起看下耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡的外觀設(shè)計(jì)。
1耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡 概覽由于采用了雙風(fēng)扇設(shè)計(jì),耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡在外包裝上也相對(duì)小巧,并且為踏雪標(biāo)志性的白色雪花設(shè)計(jì),在右側(cè)有踏雪字樣。
下面來(lái)看顯卡本體,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡整體相對(duì)圓潤(rùn),在顯卡四邊都有倒角處理。整體尺寸約為240×112×46mm(不含擋板),占用2槽空間,作為一款中高端產(chǎn)品來(lái)說(shuō),整體尺寸都非常小巧,能夠兼容ITX機(jī)箱。
散熱方面,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡整體采用了“踏雪Mini”散熱器。主動(dòng)散熱的風(fēng)扇部分,采用優(yōu)化后的2個(gè)92mm炫風(fēng)之刃風(fēng)扇,經(jīng)改良后提升風(fēng)流量,并減低聲噪,有效加強(qiáng)散熱,纖巧的體積更可大大減低對(duì)機(jī)箱空間的要求。而風(fēng)扇中央的扇標(biāo)設(shè)計(jì),則是熟悉的“雪花標(biāo)”。
內(nèi)部散熱上,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡采用大面積緊密散熱鰭片,高效銅板搭配多跟6mm復(fù)合式熱導(dǎo)管。
耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡的背板采用了踏雪系列標(biāo)志性的純白配色,帶有耕升的英文字樣,并有不規(guī)則雪花作為點(diǎn)綴。背板采用了穿透式散熱系統(tǒng)設(shè)計(jì),右方進(jìn)一步加大積鏤空間。
視頻輸出接口上,依舊采用了HDMI 2.1 + DP 1.4a*3的四接口設(shè)計(jì)。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。
耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡側(cè)面可以看到16pin供電接口,它的TDP功耗為220W,建議電源600W及以上。
2NVIDIA GeForce RTX 4070 SUPER 架構(gòu)淺析本次發(fā)布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構(gòu)打造,采用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達(dá)到了的760億個(gè)晶體管,而在RTX 30系顯卡中為280億個(gè)。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達(dá)到90-TFLOPS的著色器數(shù)據(jù)吞吐量。
本次發(fā)布的RTX 4070 SUPER共有7168個(gè)CUDA核心,提供了35.5-TFLOPS算力;56個(gè)第三代Ada RT Core擁有82.1 RT-TFLOPS;224個(gè)第四代Tensor Core可提供568 Tensor-TFLOPS(AI TOPS)。
RTX 4070 SUPER的L2 Cache容量為48MB,帶寬為504 GB/s。NVIDIA官方也特別表明了L2 Cache的重要性,我們以兩張圖來(lái)簡(jiǎn)單說(shuō)明L2緩存的作用。
在真正的GPU中,內(nèi)核是所有計(jì)算發(fā)生的地方,而這就是L1數(shù)據(jù)緩存的作用所在。每個(gè)SM都有一個(gè)超低延遲的L1數(shù)據(jù)緩存,緊挨其處理內(nèi)核,使L1成為GPU尋找信息的首選。然而由于L1緩存需要離內(nèi)核非常近,不可能非常大。
如果在L1緩存中找不到內(nèi)核計(jì)算所需的數(shù)據(jù),GPU將在L2數(shù)據(jù)緩存中尋找。這個(gè)顯存系統(tǒng)位于GPU芯片上,并通過(guò)一個(gè)非常高速的橫梁系統(tǒng)連接到所有的GPC(圖形處理集群),每個(gè)GPC包括多個(gè)SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數(shù)據(jù)并將其放入內(nèi)核。
如果在L2緩存中找不到信息(被稱為緩存缺失),那么GPU將通過(guò)顯存接口在VRAM中尋找。這在整個(gè)GPU存儲(chǔ)子系統(tǒng)中產(chǎn)生了很多額外的工作量,并降低了性能和功耗效率。
更多詳細(xì)的參數(shù),我們?yōu)榇蠹铱偨Y(jié)出了一張表格,可以看到從各方面的規(guī)格來(lái)說(shuō),這張RTX 4070 SUPER更接近于RTX 4070 Ti,但功耗相比RTX 4070只提升了20W。
3測(cè)試平臺(tái)簡(jiǎn)介首先介紹一下測(cè)試平臺(tái),為了保障耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡的性能發(fā)揮,我們的平臺(tái)采用了上代旗艦i9-13900K。
下面還是來(lái)看看本次評(píng)測(cè)的顯卡參數(shù),目前最新的GPU-Z為2.60版本,參數(shù)識(shí)別較為詳細(xì)。
耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡擁有7168個(gè)CUDA,Boost頻率為2535MHz,較公版的2475MHz提升較大,但相比3風(fēng)扇踏雪的2550MHz有小幅下降。
顯存方面,12GB GDDR6X顯存,位寬為192bit,顯存帶寬504 GB/s,光柵單元和紋理單元為80和224。
4理論性能測(cè)試本次耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡主要對(duì)比它的上下型號(hào),RTX 4070 Ti以及RTX 4070。
下面先進(jìn)行的是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對(duì)應(yīng)顯卡在1080P、2K、4K的理論性能,取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下:
在FS測(cè)試中,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相比RTX 4070,其中FS提升16%;FSE提升15%;FSU提升21%,綜合提升17%。對(duì)比RTX 4070 Ti,綜合成績(jī)相差4%左右。
而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相較RTX 4070的提升分別為:TS提升14%;TSE提升14%,綜合約為14%。對(duì)比RTX 4070 Ti,綜合成績(jī)相差8%左右。
PortRoyal是3DMARK中專門(mén)針對(duì)光追性能的測(cè)試項(xiàng),耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相較RTX 4070的提升約為15%。對(duì)比RTX 4070 Ti,相差9%左右。
下面我們?cè)賮?lái)看看3DMARK中新增的一些具體應(yīng)用場(chǎng)景的測(cè)試。
Speed Way這項(xiàng)測(cè)試結(jié)合了實(shí)時(shí)光線追蹤和傳統(tǒng)渲染技術(shù)來(lái)測(cè)量顯卡性能。場(chǎng)景含有光線追蹤反射、實(shí)時(shí)全局光照、網(wǎng)格著色器、體積照明、粒子和后處理效果。所以SW的測(cè)試基本可以看做次世代3A游戲基準(zhǔn)。
耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡對(duì)比RTX 4070,提升為16%。
在DLSS 3的理論測(cè)試中,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡在2K分辨率下DLSS開(kāi)關(guān)相比RTX 4070的提升為15%/22%;4K分辨率,提升約為16%/22%。
從整體的理論測(cè)試成績(jī)來(lái)看,傳統(tǒng)的FS/TS/PR三項(xiàng)測(cè)試,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相比RTX 4070綜合提升約為16%左右;相比RTX 4070 Ti的差距在6%左右。
5游戲 性能測(cè)試首先來(lái)測(cè)試一下由虛幻5引擎制作的《黑神話:悟空》,這款游戲支持DLSS以及FSR,并且均可開(kāi)啟幀生成,但是DLSS可以搭配全景光線追蹤提供更逼真絲滑的游戲體驗(yàn),所以我們本次DLSS測(cè)試,均在開(kāi)啟幀生成下記錄幀數(shù)。
測(cè)試分別在2K及4K分辨率下進(jìn)行,雖然RTX 4070 SUPER這張顯卡定位2K高幀率的3A游戲,不過(guò)可以看到,在DLSS超級(jí)性能模式下,這張耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡也有著80幀的流暢水準(zhǔn)。不過(guò)想要在打斗中享受電競(jìng)級(jí)幀率體驗(yàn),還是建議在2K分辨率下。
另外目前《黑神話:悟空》的benchmark跑分軟件沒(méi)有全屏獨(dú)占,只有窗口化全屏,所以在游戲內(nèi)設(shè)置低分辨率,而桌面仍然用高分辨率的話,幀數(shù)提升并不明顯。
經(jīng)過(guò)實(shí)測(cè),我們發(fā)現(xiàn)兩端同步調(diào)節(jié)分辨率,相比只降低游戲分辨率,幀數(shù)差距非常大。如果玩家想通過(guò)降低分辨率來(lái)獲得流暢的幀數(shù),還需特別注意。
DLSS 效果對(duì)比
《黑神話:悟空》是目前我見(jiàn)過(guò)游戲中,DLSS效果最好的??梢钥吹剑捎谟袕?fù)雜模型作為支撐,即便是在超級(jí)性能模式中,場(chǎng)景中所有的景物,包括主角的衣服,都和原生畫(huà)質(zhì)幾乎毫無(wú)區(qū)別,但幀數(shù)相比原生畫(huà)質(zhì),足足提升了200%還多。所以如果你感覺(jué)幀數(shù)不夠,大可以將超采樣清晰度降低一些,來(lái)獲得穩(wěn)定的高幀率。
在《極限競(jìng)速:地平線5》中,其中耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相比RTX 4070提升明顯,1080p達(dá)到12%,2K分辨率提升14%;4K分辨率提升17%,綜合提升14%。
在《刺客信條:幻景》中,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相比RTX 4070的提升分別為:1080p提升8%;2K提升9%;4K提升15%,綜合提升11%。
在《無(wú)主之地3》中,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相比RTX 4070的提升分別為:1080p提升21%;2K提升16%;4K分辨率提升16%,綜合提升18%。
《光明記憶:無(wú)限》的光追測(cè)試軟件是獨(dú)立于游戲的測(cè)試工具,比游戲中用到的光線追蹤技術(shù)更多,測(cè)試條件為“RTX最高/DLSS質(zhì)量”。
性能方面,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡相比RTX 4070的提升分別為:1080p提升19%;2K提升22%;4K提升26%,綜合提升22%。
在“游戲測(cè)試標(biāo)桿”的《賽博朋克2077》中,耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡在超級(jí)畫(huà)質(zhì)下,2K分辨率百幀完全沒(méi)有問(wèn)題的;在光追超級(jí)畫(huà)質(zhì)下2K流暢運(yùn)行同樣沒(méi)有問(wèn)題;而作為次世代光追體驗(yàn)的超速模式中,2K分辨率下只有52幀。
不過(guò)上面我們的測(cè)試均為DLSS 2模式,尚未開(kāi)啟DLSS 3,下面在DLSS 3的專項(xiàng)測(cè)試中,能夠看到幀數(shù)上的飛躍。
從上至下依次為超級(jí)畫(huà)質(zhì)/光追超級(jí)/光線追蹤:超速模式。可以看到光線追蹤:超速模式相比光追超級(jí)更貼近于真實(shí)效果。它模擬了真實(shí)的光線路徑,其實(shí)相比之前的光線追蹤模擬了更多光線在不同表面的反射,完整的計(jì)算出了場(chǎng)景的真實(shí)光照,避免了上一代光追中出現(xiàn)“死黑”的情況。
另外《賽博朋克2077》更新了DLSS 3.5,支持光線重建技術(shù)。在上面的測(cè)試圖中不難發(fā)現(xiàn),光線重建能夠更加精準(zhǔn)的計(jì)算出反射部分的效果,接近于亮面金屬表面的反射中,未開(kāi)啟RTX能夠看出畫(huà)質(zhì)明顯的區(qū)別,不再贅述。重點(diǎn)在于DLSS 3.5的開(kāi)關(guān)效果,除了廣告牌上所顯示的內(nèi)容更清晰外,放大后能夠看到遠(yuǎn)處電線以及工業(yè)區(qū)建筑的細(xì)節(jié)外觀。
6DLSS 3性能測(cè)試隨著NVIDIA DLSS、NVIDIA Reflex以及先進(jìn)的光線追蹤技術(shù)的普及速度不斷加快,現(xiàn)在已有超過(guò)600款RTX游戲和應(yīng)用,為配備 GeForce RTX 40 系列顯卡的游戲玩家?guī)?lái)前所未有的性能和更高的圖像質(zhì)量。
在DLSS 3的測(cè)試中,首先來(lái)看《賽博朋克2077》的,我們同樣會(huì)將DLSS 3與DLSS 2的結(jié)果進(jìn)行比對(duì)。
本次我們分別對(duì)《賽博朋克2077》,在三檔畫(huà)質(zhì)下進(jìn)行了DLSS 3的幀數(shù)測(cè)試,所有檔位均開(kāi)啟DLSS質(zhì)量記錄幀數(shù)。
可以看到在2K分辨率下,在是光追超速模式,開(kāi)啟DLSS 3后耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡能達(dá)到80幀的成績(jī),已經(jīng)是流暢運(yùn)行標(biāo)準(zhǔn)。
另外DLSS 3技術(shù)主要針對(duì)于CPU瓶頸的游戲,所以也能夠看到在越低的分辨率,幀數(shù)提升越大,其中光追超速的1080p分辨率能夠達(dá)到50%左右的提升。
《地平線5》也是顯卡測(cè)試的老朋友了,其出色的優(yōu)化讓很多入門(mén)級(jí)產(chǎn)品都能跑出較高的幀率。在耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡也有較明顯的體現(xiàn)。在3種分辨率中,開(kāi)啟DLSS 3相比DLSS 2的提升分別為39%/28%/12%。
7 生產(chǎn)力工具測(cè)試V-Ray
在生產(chǎn)力工具上,我們測(cè)試了最新版本的V-Ray渲染器,選擇使用GPU渲染的CUDA測(cè)試和RTX測(cè)試,成績(jī)?nèi)鐖D。
Blender
Blender是一款專業(yè)的三維渲染軟件,目前推出了固定的benchmark跑分軟件,省去了安裝軟件下載素材的麻煩。軟件會(huì)自動(dòng)渲染測(cè)試
monster/junkshop/classroom共三個(gè)場(chǎng)景。
耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡得分分別為3023/1464/1536分,平均2008分。
8AIGC測(cè)試-ProcyonAI時(shí)代不知何時(shí)已經(jīng)離人們的生活越來(lái)越近,小到文本改寫(xiě),大到各種生成式AI。此前我們已經(jīng)測(cè)試過(guò)Stable Diffusion的AI繪圖能力,不過(guò)目前NVIDIA推出了全新的TensorRT插件,可以充分調(diào)用Tensor算力,下面我們來(lái)測(cè)試一下耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡在這方面的性能表現(xiàn)。
我們的測(cè)試使用UL Procyon進(jìn)行,在最新的測(cè)試項(xiàng)目中,SD1.5可分為INT8(8位整數(shù))和FP16(半精度浮點(diǎn))運(yùn)算。
可明顯看到,采用INT8的運(yùn)算時(shí)間更快,不過(guò)這并不意味著INT8在性能上更具優(yōu)勢(shì)。
這里簡(jiǎn)單說(shuō)明一下,INT8是使用更低精度的整數(shù)表示數(shù)據(jù)的一種方式,用于進(jìn)一步減小模型的存儲(chǔ)空間和加快計(jì)算速度。使用INT8可以在一定程度上降低模型的計(jì)算復(fù)雜度,特別適用于部署在資源有限的設(shè)備上,如移動(dòng)設(shè)備、嵌入式設(shè)備等。
FP16則是一種占用存儲(chǔ)空間較小的浮點(diǎn)數(shù)表示方法,用于在深度學(xué)習(xí)模型中減少模型參數(shù)和中間結(jié)果的存儲(chǔ)需求,從而節(jié)省內(nèi)存空間并提高計(jì)算效率。
不過(guò)在測(cè)試中并沒(méi)有包含F(xiàn)P32的單精度浮點(diǎn)運(yùn)算,其實(shí)在深度學(xué)習(xí)模型中,完整的邏輯應(yīng)當(dāng)包含在內(nèi),下面也簡(jiǎn)單進(jìn)行介紹。
FP32是常見(jiàn)的浮點(diǎn)數(shù)表示方式,提供了更高的數(shù)值精度,適用于大多數(shù)深度學(xué)習(xí)模型的訓(xùn)練和推理過(guò)程。FP32 的精度比FP16高,但會(huì)占用更多的存儲(chǔ)空間和計(jì)算資源。
所以從運(yùn)算精度上來(lái)說(shuō):FP32 > FP16 > INT8;而從內(nèi)存占用上來(lái)說(shuō)是:INT8 < FP16 < FP32。它們之間的精度和內(nèi)存占用為正比的關(guān)系。
上圖測(cè)試結(jié)果為模型更復(fù)雜的SDXL,可以看到測(cè)試總時(shí)間為262.015s;約合13.376 s/image。
另外,UL Procyon的AIGC測(cè)試同樣使用了StableDiffusion進(jìn)行批量生成,相較我們手動(dòng)生成圖片,結(jié)論更為精準(zhǔn)。
9 RTX 視頻超分辨率(RTX Video Super Resolution)測(cè)試目前RTX 視頻超分辨率(RTX Video Super Resolution)已經(jīng)在部分瀏覽器中進(jìn)行測(cè)試,首先玩家需要更新到NVIDIA最新驅(qū)動(dòng),在NVIDIA控制面板中的可以看到最新的RTX 視頻增強(qiáng)超分辨率。
RTX 視頻超分辨率是 AI 圖像處理的突破,它超越了傳統(tǒng)的邊緣檢測(cè)和特征銳化技術(shù),極大地提升直播視頻內(nèi)容的質(zhì)量。
開(kāi)啟RTX 視頻超分辨率不僅需要最新版驅(qū)動(dòng),還需要使用RTX 40或30系列GPU,并且?guī)缀踹m用于Google Chrome和Microsoft Edge瀏覽器中的所有視頻內(nèi)容(瀏覽器也需要更新到最新版本)。
開(kāi)啟后,目前已知的打開(kāi)YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時(shí),可以打開(kāi)任務(wù)管理器,看到GPU負(fù)載增加,即為開(kāi)啟成功。
在下面這幅圖的對(duì)比中,可以明顯看到開(kāi)啟RTX 視頻超分辨率后,胡須明顯更順滑,已經(jīng)看不出馬賽克。
不過(guò)需要注意的是,RTX 視頻超分辨率在低分辨率下效果會(huì)更明顯,如果本身觀看的視頻為1080p或2K以上,則基本很難看出區(qū)別。
這對(duì)于一些網(wǎng)速不夠快,只能看低分辨率視頻的用戶,或者視頻片源本身不夠清晰的情況,幫助非常大。
10溫度及功耗測(cè)試功耗測(cè)試中,我們選擇FurMark軟件進(jìn)行拷機(jī)測(cè)試,并采用GPU-Z檢測(cè)溫度,功耗僅計(jì)算顯卡自身。
在最新的Furmark中,已經(jīng)集成了相當(dāng)多的功能,甚至還有benchmark跑分,不再是單純的拷機(jī)軟件。
耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡通過(guò)35分鐘左右的拷機(jī)測(cè)試,溫度在71℃左右,熱點(diǎn)溫度在82℃左右。
11高性能ITX神器RTX 4070 SUPER對(duì)于大部分玩家來(lái)說(shuō)已經(jīng)非常熟悉了,相比RTX 4070提升在15-20%左右,與RTX 4070 Ti的差距在5%左右,提升是巨大的,基本已經(jīng)追到了RTX 4070 Ti的級(jí)別。
雖然從系列定位來(lái)看,RTX 4070 SUPER依然是一張定位2K分辨率的游戲顯卡,但從性能來(lái)說(shuō)它“進(jìn)”可在4K暢玩獨(dú)立大作,“退”可在1080p分辨率享受超高的電競(jìng)級(jí)幀率,而日常2K分辨率下,3A游戲百幀也是不成問(wèn)題。
耕升這款耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡不僅集成了RTX 4070 SUPER的強(qiáng)大性能,更采用了雙風(fēng)扇小尺寸設(shè)計(jì),可兼容絕大部分ITX機(jī)箱。
雖然雙風(fēng)扇在一定程度上讓它的工作溫度有所升高,但仍在正常范圍內(nèi)。不過(guò)相對(duì)來(lái)說(shuō)更適合北方用戶,而對(duì)于南方每年有八九個(gè)月溫度在30℃以上的地區(qū),還需要更良好的降溫條件。
目前耕升GeForce RTX 4070 SUPER 踏雪Mini顯卡在各大電商中均有售賣,感興趣玩家不妨前去了解一下。