Categories: 桌上電腦

【評測】NVIDIA RTX 4070 SUPER 顯示卡 詳細測試 + 性能直迫 RTX 3090 旗艦卡

Published by
Lawton
Share

NVIDIA GeForce RTX 4070 SUPER 正式到了香港 unwire 編輯部,以下將為大家做效能評測。這張卡是 NVIDIA 最新 RTX 40 系 SUPER 顯示卡,新一批 SUPER 版顯示卡將在官方價錢相同(RTX 4070 SUPER 官方建議零售價為  US$599, 約港幣 HK$4,676)的情況下,對比原版帶來效能提升。畢竟最初部份 RTX 40 系中階卡推出市面時,價錢一直高遽不下,現在遊戲玩家們終於等到更為抵用的中階產品。打頭炮的 RTX 4070 SUPER 效能同各種表現又如何呢?馬上同大家一齊了解。

 

 

今次測試的 NVIDIA GeForce RTX 4070 SUPER 屬於 Founders Edition 公版卡,簡單來說就是配備最基本的散熱器、標準的運作頻率。如果想要散熱器更大、升級頻率就要留意陸續會推出的副廠卡。相對於最初期版的深色金屬外殼與 Ti 版的亮麗金屬外殼,這張 SUPER 公版卡用上了黑色金屬外殼,雕刻的字體都沒有印色,設計更加低調。SUPER 公版卡的卡身厚度、大小亦與初期版 RTX 4070、4060 Ti 沒有可看得出的分別。

 

▲較早前推出的 RTX 4070 與今次最新推出的 RTX 4070 SUPER 公版相比,卡身大小沒有可見的分別

▲歷來公版卡都只是兩個 size,今次 RTX 4070 SUPER 屬於「細卡」

▲厚度方面,今次新出的 RTX 4070 SUPER 同樣是兩插槽厚度

 

供電方面,RTX 4070 SUPER 用上 PCIe 5.0 供電轉換線,用上 2 組 PCIe 8-pin 供電,與 RTX 4070、4060 Ti 相同。

 

 

卡身細小散熱效能高

RTX 4070 SUPER 跟原版 RTX 4070 同樣採用 5nm 製程的 AD104 核心,原生有 7680 個 CUDA 核心,不過原版只開啟了其中的 5888 個,今次 SUPER 版就開啟了 7168 個。而 ROP 單元與 TMU 紋理映射單元從 RTX 4070 的 64 ROPs, 184 TMUs,加大至 RTX 4070 SUPER 版本的 80 ROPs, 224 TMUs。另外基本 GPU 基礎時脈由 RTX 4070 原本的 1920MHz,略為提升至 RTX 4070 SUPER 版的 1980MHz。

 

▲插上機箱後可見其佔據空間不多

 

至於其他規格很多都一樣,RTX 4070 與 RTX 4070 SUPER 兩張公版卡比較,記憶體同樣使用 GDDR6X 容量同樣是 12GB、記憶體頻寬同樣是 504.2GB/s、記憶體時脈同樣是 1313MHz、Boost 時脈都同樣是 2475MHz。

 

 

今次 RTX 4070 SUPER 版的走向,是採用在 RTX 4070 的基礎上,給予用家更好的效能。它仍然是一張中階卡,NVIDIA 希望現在晶片產量充足、價格寬容度可以更好的情況下,給予用家一個很好的藉口升級(畢竟用家買新款卡,總比買舊卡來得更開心)。

 

NVIDIA RTX 中階顯示卡規格

RTX 4070 SUPER RTX 4070 Ti RTX 4070 RTX 3070(8GB OC版) RTX 3090(24GB OC版)
製程 5nm 5nm 5nm 8nm 8nm
Shaders 7168 7680 5888 5888 10496
ROPs/TMUs 80/224 80/240 64/184 96/184 112/328
Pixel Fillrate 198.0GPixel/s 217.2GPixel/s 158.4GPixel/s 174.2GPixel/s 208.3 GPixel/s
Texture Fillrate 554.4GTexel/s 651.6GTexel/s 455.4GTexel/s 334.0GTexel/s 610.1 GTexel/s
GPU時脈 1980MHz 2310MHz 1920MHz 1500MHz 1395MHz
記憶體容量 12288MB 12288MB 12288MB 8192MB 24576MB
記憶體頻寬 504.2GB/s 504.2GB/s 504.2GB/s 448.0GB/s 936.2GB/s
記憶體時脈 1313MHz 1313MHz 1313MHz 1750MHz 1219MHz
Boost 時脈 2475MHz 2715MHz 2475MHz 1815MHz 1860MHz

 

我們在拆卡之下,可發現晶片型號,以及了解到它用上同 RTX 4070 看不出有分別的散熱系統。我們在電腦上運作 Furmark 令到顯示卡以全速運作,然後看看晶片溫度、能耗,以及用散熱槍測量卡面、散熱器溫度。我們可發現 RTX 4070 SUPER 能耗比較 RTX 4070 稍為大一點點,但又沒有去到 RTX 4070 Ti 的程度。

 

▲NVIDIA AD104-350-A1 繪圖核心

▲卡上共有 6 個 Micron D8BZC GDDR6X 顆粒

 

溫度上也沒有很明顯分別,GPU Temp 軟件顯示兩者晶片溫度都同樣是攝氏 70 度。只是在測溫槍偵測晶片背面溫度時,RTX 4070 SUPER 版稍為熱攝氏 4 度,都是屬於很正常溫度,並沒有發生爆熱情況。

 

顯示卡功耗與溫度

功耗* 晶片溫度 晶片背後卡溫度 散熱器溫度
RTX 4070 SUPER 345W 70℃ 53℃ 45℃
RTX 4070 Ti 420W 74℃ 55℃ 36℃
RTX 4070 326W 70℃ 49℃ 44℃
RTX 3090 500W 67℃ 53℃ 41℃
RTX 3070 369W 66℃ 49℃ 38℃

*測試平台靜止時功耗為 70W

 

▲在全速運轉時,RTX 4070 SUPER 晶片溫度為攝氏 70 度

▲公版卡全速運作 5 分鐘後,晶片背後溫度為 52.7 度、散熱器溫度為 45.5 度,處於一個相對平穩的溫度,不會發生爆熱情況

▲靜止狀態下測試平台的功耗為 70W,而在 RTX 4070 SUPER 全速運轉時,系統功耗為 345W,只略為比 RTX 4070 多一點

 

測試平台

CPU:Core i9-10900k

顯示卡: Nvidia GeForce RTX 4070 SUPER Founder Edition

主機板:ASUS ROG Maximus XII Extreme Intel Z490 E-ATX

記憶體: Team Group-UD4-3000 16GB

儲存裝置:WD S100T3X0C 00SJG0 1TB SSD

驅動程式:31.0.15.4652(NVIDIA 546.52) DCH/Win 11 64

 

 

3DMark 跑分表現--價錢一樣之下比 RTX 4070 快 17%

既然放熱量、功耗相差不大,實際效能如何呢?在測試遊戲之前,我們先用 3DMark 軟件跑分來看看顯示卡的基本效能。從 Time Spy 跑分測試中,可發現 RTX 4070 SUPER 比起原版 RTX 4070 有著 16.7% 效能提升;而 RTX 4070 Ti 也是只比 RTX 4070 SUPER 再快個 8%。明顯 SUPER 新卡是夾於兩者之間,同高效版 RTX 4070 Ti 效能已是非常之接近。NVIDIA 在宣傳本卡時提到它已經超過舊款旗艦卡。在實際跑分上我們看到,RTX 4070 SUPER 這張升級版中階卡,跑分已爬頭過了上一代旗艦卡 RTX 3090 的 20520 分,更快過上代 RTX 3070 達 50.3%。

 

顯示卡 3DMark 效能測試

Time Spy 差距% Port Royal 差距% Ray Tracing
RTX 4070 SUPER 20691 12873 61.79fps
RTX 4070 Ti 22353 -7.4% 13786 -6.6% 66.47fps
RTX 4070 17729 +16.7% 11129 +15.7% 51.34fps
RTX 3090 20520 +0.83% 13607 -5.4% 58.13fps
RTX 3070 13765 +50.3% 8451 +52.3% 32.67fps

 

NVIDIA RTX 系列顯示卡,支援 DLSS 深度學習超高取樣技術,利用人工智能提升畫面流暢度。現時已有很多遊戲,特別是大部份大作遊戲,都支援 DLSS,大幅提升遊戲流暢度。而在 RTX 40 系支援的最新一代 DLSS 3.5 技術中,加入了 Frame Generation 影格生成技術,在支援此技術的遊戲中,可獲得很大幅度的效能提升。在實際測試遊戲之前,我們先看在 3DMark 上會有甚麼測試結果。

 

顯示卡 3DMark DLSS Feature Test

4K 2K
RTX 4070 SUPER 97.81fps 149.92fps
RTX 4070 Ti 103.84fps 159.16fps
RTX 4070 85.60fps 131.17fps
RTX 3090 76.50fps 133.70fps
RTX 3070 50.60fps 93.51fps

 

我們發現在 4K 測試中,RTX 4070 SUPER 對比原版 RTX 4070 有著 14% 效能提升。至於同上代 RTX 3070 顯示卡的 50.60fps 相比,RTX 4070 SUPER 版顯示卡大幅提升至 97.81fps,效能增長達 93%。

 

 

 

實際遊戲測試--DLSS 3.5 Frame Generation「影格生成」令效能提升 25~80%

在 DLSS 3.5 Frame Generation 影格生成技術的加持下,RTX 40 系顯示卡在現實世界的遊戲表現中,獲得巨大的效能貢獻。今次我們測試的 3 款遊戲大作《Cyberpunk 2077》、《Star Wars Jedi: Survivor》、《霍格華茲的傳承》都同樣支援影格生成技術。

 

 

之前我們提及 RTX 4070 SUPER 在 3DMark 跑分上同上代旗艦卡 RTX 3090 睇齊。不過我們想特別強調,RTX 40 系的影格生成技術,令到本次測試的新款中階卡,甚至能在大作遊戲上大幅贏過舊一代旗艦卡。大家看看以下實測結果:

RTX 4070 SUPER 影格生成(Frame Generation)技術效能表現

開啟 Frame Generation 關閉 Frame Generation 開啟 Frame Generation 後效能提升 RTX 3090
《霍格華茲的傳承》RayTracing ON 75fps 56fps +36% 54fps
《Star Wars Jedi: Survivor》RayTracing ON 48fps 26fps +84% 26fps
《Cyberpunk 2077》 RayTracing ON 58.85 39.75 +48% 40.83
《Cyberpunk 2077》 RayTracing OFF 76.66 60.63 +26% 66.16

 

我們嘗試在遊戲中開啟影格生成的相關選項,在這次 RTX 4070 SUPER 的影格生成技術下,《霍格華茲的傳承》從原本的 56fps 大幅提升至 75fps,獲得了36%的效能提升。效能差距最大分別是《Star Wars Jedi: Survivor》,在開啟了影格生成功能後,效能可提升 84%,遊戲畫面流暢度獲得了脫胎換骨的表現。於《Cyberpunk 2077》裡面即使開啟了 Ray Tracing 光線追蹤功能,在影格生成的支援下,流暢度非常接近 60fps,也比沒開時提升了 48% 表現。

 

▲即使是同一張卡,如果沒有開啟 Frame Generation 功能,性能都未算開盡

▲在開啟了 Frame Generation 功能後,所有設定一樣,顯示卡能讓遊戲發揮更好效果

 

我們在《Star Wars Jedi: Survivor》開啟了遊戲的「最高」畫面品質,且在 DLSS 3 選項中使用了「高品質」的選項。在上代旗艦 RTX 3090 之下我們只有約 26fps 很窒的遊戲畫面,但換上了今代中階卡 RTX 4070 SUPER 後,大幅提升到 48fps,在最高畫質下流暢度變得很不錯,你可略為減去某些畫面表現增強一下流暢度。

 

 

更多遊戲效能測試--RTX 4070 SUPER 表現再升一級

RTX 4070 SUPER 宗旨提為用家提供一張價錢吸引,效能再進一步的中階顯示卡。我們今次測試了 5 款遊戲的效能表現,可發現 RTX 4070 SUPER 大致上都比 RTX 4070 提升了效能大約 10~15%,差不多追上,甚至是追上 RTX 4070 Ti 的表現。

 

 

如果同舊世代顯示卡相比,就有更大幅度的效能表現差距。一些對於 Frame Generation 技術投入更大的遊戲,效能差距就愈明顯。在《霍格華茲的傳承》裡 RTX 4070 SUPER 比舊世代 RTX 3090 效能提升了 38%、比 RTX 3070 效能提升 60%;在《Forza Horizon 5》裡面 RTX 4070 SUPER 比舊世代 RTX 3090 效能提升了 23%、比 RTX 3070 效能提升 125%。在《Assassin’s Creed Mirage》裡面我看到效能提升也相當明顯, RTX 4070 SUPER 對比 RTX 3090 快了 28%、對比 RTX 3070 直接快了 53%。

 

《Cyberpunk 2077》遊戲效能測試

顯示卡 開啟RayTracing 流暢度# 關閉RayTracing 流暢度#
RTX 4070 SUPER 58.85fps 76.66fps
RTX 4070 Ti 59.37fps 77.03fps
RTX 4070 51.67fps 64.12fps
RTX 3090 40.83fps 66.16fps
RTX 3070 28.77fps 51.66fps

#使用遊戲內的效能測試工具計測。4K 解像度全螢幕、DLSS Super Resolution 設定為「Performance」、DLSS Sharpness 設定為 0.05、Texture Quality 設定為「High」、光線追蹤開啟時 Ray-Traced Lighting 設定為「Ultra」、DLSS Frame Generation 在 40系顯示卡上設定為「ON」。

▲在 4K 畫質下可得到最高 76.66fps

 

《霍格華茲的傳承》遊戲效能測試

顯示卡 流暢度*
RTX 4070 SUPER 75fps
RTX 4070 Ti 78fps
RTX 4070 67fps
RTX 3090 54fps
RTX 3070 47fps

*每個測試記錄一段極之相近的遊戲片段,並由測速軟件計測畫格流暢度。4K 解像度全螢幕、圖形選項的全域品質預設設定為「超高」、NVIDIA DLSS 設定為「品質」、幀數生成在 40 系顯示卡上設定為「開」

 

 

《Star Wars Jedi: Survivor》遊戲效能測試

顯示卡 流暢度*
RTX 4070 SUPER 48fps
RTX 4070 Ti 47fps
RTX 4070 41fps
RTX 3090 38fps
RTX 3070 24fps

*每個測試記錄一段極之相近的遊戲片段,並由測速軟件計測畫格流暢度。4K解像度全螢幕、圖像品質及其他畫面設定為「最高」、DLSS 設定為「高品質」、畫格生成在 40 系顯示卡上設定為「開啟」

▲在 RTX 40 系顯示卡可看到 NVIDIA 畫格生成選項

▲在使用 RTX 30 系顯示卡時 NVIDIA 畫格生成選項變成「不支援」

 

《Assassin’s Creed Mirage》遊戲效能測試

顯示卡 流暢度#
RTX 4070 SUPER 58fps
RTX 4070 Ti 57fps
RTX 4070 48fps
RTX 3090 45fps
RTX 3070 38fps

#使用遊戲內的效能測試工具計測。4K 解像度全螢幕、關閉「適應性品質」功能、上採樣品質設定為「原畫質」,其他畫面品質設定為「極高」

 

《Forza Horizon 5》遊戲效能測試

顯示卡 流暢度#
RTX 4070 SUPER 91.6fps
RTX 4070 Ti 89.3fps
RTX 4070 75.4fps
RTX 3090 74.6fps
RTX 3070 40.7fps

#使用遊戲內的效能測試工具計測。4K 解像度全螢幕、DLSS 設定為「品質」、DLSS 清晰度為「0.5」、Frame Generation 選項在 40 系顯示卡上設定為「開啟」

 

《Marvel’s Spider-Man: Miles Morales》遊戲效能測試

顯示卡 流暢度*
RTX 4070 SUPER 90fps
RTX 4070 Ti 93fps
RTX 4070 80fps
RTX 3090 72fps
RTX 3070 53fps

*每個測試記錄一段極之相近的遊戲片段,並由測速軟件計測畫格流暢度。4K 解像度全螢幕、DLSS 設定為「高品質」

 

桌面 3D 軟件效能表現--V-Ray Benchmark

除了遊戲之外,好多 3D 設計軟件都用到顯示卡運算效能。V-Ray Benchmark 就是一個獨立的效能測試軟件,支援各種顯示卡、顯示晶片。今次在效能測試結果就可看到 40 系顯示卡的威力:在 RTX 4070 SUPER 中階卡的分數,已超過了上代旗艦卡 RTX 3090。如對比價位相近的 RTX 4070,RTX 4070 SUPER 的效能也有 20% 的提升。

V-Ray Benchmark GPU 效能表現

vpaths
RTX 4070 SUPER 4803
RTX 4070 Ti 4646
RTX 4070 4001
RTX 3090 4678
RTX 3070 2890

 

遊戲效能以外的表現 1--「RTX Video Super Resolution」影片升頻技術

NVIDIA RTX 顯示卡在其他日常應用上,都利用顯示卡的運算效能提升畫面流暢度、運算速度,甚至實時為影片提升畫質。NVIDIA 就為 40 系及 30 系顯示卡加入「RTX Video Super Resolution」影片升頻技術(下稱 VSR)。透過 Google Chrome、Microsoft Edge 等瀏覽器,收看 YouTube、Netflix、Disney+ 等串流影片,又或者透過最常見的 VLC Player 多媒體播放器播放電腦中儲存的影片,都可獲得升頻效果提升畫質。

 

 

VSR 技術對於 720p 或以下的影片帶來非常明顯可見的畫質提升效果。特別是一些線條比較明顯的卡通/動畫影片或串流廣播,例如 Twitch 上的遊戲直播。

 

▲關閉 VSR

▲開啟 VSR

 

在真人演出的直播節目或串流節目,如果畫質在 720p 或者 480p,你都可以很明顯看到畫面清晰度獲得提升。

 

 

關閉VSR

開啟VSR

 

 

要開啟 VSR 的方法很簡單。先打開 NVIDIA 控制面板,從畫面左手邊的選單打開「調整影像設定」畫面。在「RTX 視訊增強」選項中,選擇1-4等級,數字愈大效果愈明顯,但耗用的處理資源會愈多。

 

 

遊戲效能以外的表現 2--支援實時光線追蹤的 3D 渲染器「D5 Render」

光線追蹤技術與顯示卡效能,都有應用在 3D 設計軟件上。這次示範的 D5 Render 就是一款支援實時光線追蹤顯示的建築、景觀、效果圖設計軟件。D5 Render 支援 DLSS 3.5 技術包括 DLSS Ray Reconstruction、DLSS Super Resolution 以及 DLSS Frame Generation。而它在不同 NVIDIA RTX 顯示卡上都會有不同的效能表現。我們嘗試過在支援 Frame Generation 影格生成的 RTX 40 系顯示卡上,可獲得 30fps 或以上的表現;相反沒有 Frame Generation 的 RTX 30 系顯示卡,最多只有 18fps 表現。

 

 

D5 Render 效能測試

Frame Generator ON Frame Generator OFF
RTX 4070 SUPER 35fps 19fps
RTX 4070 Ti 36fps 20fps
RTX 4070 30fps 16fps
RTX 3090 n/a 18fps
RTX 3070 n/a 8fps

每個測試記錄一段相同的片段,並由測速軟件計測畫格流暢度。

 

遊戲效能以外的表現 3--AI 相片解像度提升軟件「ON1 Resize AI 2023」

NVIDIA 顯示卡也被用在處理各種 AI 人工智能應用。今次測試的 ON1 Resize AI 2023,就利用到 AI 人工智能為相片、低解像度圖片提升畫面解像度。相對於使用 CPU 效能,GPU 可大幅提升處理時間,每張數碼相機拍攝的 6000×4000 解像度放大 200%,相片處理時間可少於 20 秒。

 

 

總結:相同價錢有更佳效能

綜合不同測試結果,本文主角 RTX 4070 SUPER 顯示卡在原本的 RTX 4070 之上效能提升 10~15%,而官方建議零售價則維持不變。相信 NVIDIA 都會讓玩家直接選購 SUPER 系列顯示卡。如果你一直在持觀望態度,或者一直都買不到卡,今次 SUPER 系列顯示卡終可讓你大破慳囊。

 

 

而全新產品線除了今次介紹的 GeForce RTX 4070 SUPER 外,還有 GeForce RTX 4080 SUPER、GeForce RTX 4070 Ti SUPER。這些新卡會陸續在全球各地推出,當我們取得 NVIDIA 第一手新卡,會再為大家進行效能評測,請密切留意。

 

 

Published by
Lawton