英偉達RTX新紋理壓縮技術首測:可節省顯存96%!

時間:2025-02-11
來源:18183新聞
责任编辑:企鵝

近日,YouTube 頻道 Compusemble 對英偉達的 RTX 神經紋理壓縮(NTC)技術進行了基准測試,展示了該技術在實際 3D 工作負載中的強大能力。測試結果顯示,與傳統紋理壓縮技術相比,RTX NTC 技術能夠將紋理內存大小大幅降低約 96%。

Compusemble 在 RTX 4090 顯卡上分別以 1440p 和 4K 分辨率對 NTC 技術進行了測試。測試分為兩種模式:“NTC 轉碼為 BCn”和“樣本推理”。其中,“NTC 轉碼為 BCn”模式會在加載時將紋理轉碼為 BCn 格式;而“樣本推理”模式則僅對渲染特定視圖所需的單個 texel 進行解壓縮,從而進一步減少紋理內存大小。

在 1440p 分辨率下,當啟用 DLSS 超分功能時,“NTC 轉碼為 BCn”模式將測試應用的紋理內存占用從 272MB 降低至 98MB,減少了 64%。而“樣本推理”模式則將紋理大小降至僅 11.37MB,與非神經壓縮技術相比,內存占用減少了 95.8%,與之前的神經壓縮模式相比減少了 88%。

不過,啟用 RTX 神經紋理壓縮技術後,性能會受到一定影響。盡管如此,由於測試使用的是上一代 RTX 4090 顯卡,而非最新的 RTX 5090 顯卡,因此隨著新一代架構的推出,性能損失可能會有所減少。

在“NTC 轉碼為 BCn”模式下,平均 FPS 與未啟用 NTC 時相比幾乎沒有變化。而“樣本推理”模式的性能下降最為明顯,FPS 從 1600 多幀的中等水平降至 1500 多幀的中等水平,1% 的低值更是大幅降至 840 幀左右。

當使用 TAA 抗鋸齒而非 DLSS 超分時,內存容量的減少情況與 DLSS 相同,但 GPU 的性能表現有所不同。三種模式的運行速度都明顯快於 DLSS,FPS 接近 2000 幀。在“樣本推理”模式下,1% 的低值達到 1300 多幀,比 840 幀有了顯著提升。

將分辨率提升至 4K 後,性能顯著下降。啟用 DLSS 超分功能時,“NTC 轉碼為 BCn”模式的平均 FPS 在 1100 幀左右,“樣本推理”模式的平均 FPS 則略低於 1000 幀,兩種模式的 1% 低值都在 500 幀左右。

而關閉 DLSS,改用原生分辨率搭配 TAA 抗鋸齒時,“NTC 轉碼為 BCn”模式的平均 FPS 提升至 1700 幀左右,“樣本推理”模式的平均 FPS 在 1500 幀左右。前者的 1% 低值略低於 1100 幀,後者的 1% 低值略低於 800 幀。

此外,Compusemble 還在 4K 分辨率下,針對“樣本推理”模式測試了協同向量功能。啟用協同向量時,平均幀率在 1500 幀左右;關閉協同向量時,平均 FPS 急劇下降至略低於 650 幀。1% 的低值在啟用協同向量時略低於 750 幀,關閉時略高於 400 幀。

Compusemble 的基准測試表明,英偉達的神經壓縮技術能夠在大幅減少 3D 應用紋理內存占用的同時,以犧牲一定性能為代價,尤其是在“樣本推理”模式下。

RTX 神經紋理壓縮技術已經開發了至少幾年時間。這項新技術利用現代英偉達 GPU 中的張量核心來壓縮 3D 應用和遊戲紋理,而非傳統的塊截斷編碼。RTX NTC 是自 1990 年代以來紋理壓縮技術的首次重大升級,能夠支持比當前 GPU 運行的紋理分辨率高出四倍的紋理。

目前,RTX NTC 技術仍處於測試階段,尚未確定發布日期。有趣的是,其最低硬件要求似乎並不高。英偉達在 GitHub 上的 RTX NTC 頁面確認,最低 GPU 要求是 RTX 20 系列顯卡。此外,該技術還已在 GTX 10 系列顯卡、AMD Radeon RX 6000 系列顯卡以及 Arc A 系列顯卡上得到驗證,這意味著未來該技術有望在非 RTX 顯卡甚至遊戲主機上得到廣泛應用。

免責聲明:文中圖文均來自網絡,如有侵權請聯系刪除,18183新遊發布此文僅為傳遞信息,不代表18183認同其觀點或證實其描述。
用戶評論