在面向媒體的一場閉門演講中,英偉達揭曉定於10月12日正式到來的GeForceRTX4090顯卡的首批性能數據。盡管公開演示的參考點有些模糊,但外媒還是在幻燈片中看到一組在DLSS性能模式/4K超分辨率下的FPS性能數據。此外演示平臺使用英特爾酷睿i9-12900K處理器,搭配32GB內存、且安裝64位的Windows11操作系統。
所有測試都是在支持第三代深度學習超級采樣(DLSS 3)的遊戲中進行的,凸顯這項新技術對於性能的極大助推作用,而後英偉達還提到今明兩天的內容。
今日遊戲:
《微軟飛行模擬器》-- 103 FPS
《戰錘 40K:暗潮》-- 138 FPS
《虛幻引擎 5 - Lyra》光追演示 -- 155 FPS
《F1 22》光追演示 -- 204 FPS
《Unity Enemies》光追演示-- 89 FPS
《賽博朋克 2077》光追演示-- 141 FPS
明日遊戲:
《賽博朋克 2077》光追最高檔 / Overdrive 模式 -- 90 FPS
《NVIDIA Racer RTX》完全光追演示 -- 80 FPS
《Justice》完全光追演示 -- 81 FPS
《Portal RTX》完全光追演示 -- 117 FPS
如你所見,GeForce RTX 4090 能夠顯著提升支持高級光追特性的遊戲性能。
● 比如《微軟飛行模擬》和《戰錘 40K:暗潮》僅獲得 2 倍性能提升;
●《UE5 Demo》和《F1 22》可實現將近 3 倍提升;
●《Unity Demo》和《賽博朋克 2077》更是接近 4 倍提升。
CD Projekt RED 的遊戲將很快更新支持 RT Overdrive 模式,啟用 DLSS 3 後的 RTX 4090 可帶來 4 倍速度提升體驗 ——《Racer RTX》大約是 4.5 倍、《Justice》幾乎 5 倍、《Portal RTX》也接近 6 倍。
然後英偉達探討 Ada Lovelace GPU 架構的專屬優化光追硬件,可知率先引入光追的《戰地 5》,每像素隻需執行 39 次 RT 操作。但更先進的遊戲 —— 比如《賽博朋克 2077》超速模式 —— 會大幅提升到 635 次。
首先是被稱作著色器執行的重新排序,英偉達 GPU 工程高級副總裁 Jonah Alben 解釋稱:
在光追遊戲中,如果一些光線照射到場景的不同區域,那麼它們將無法運行相同的程序、並於首次光線運算後閑置。
好消息是,通過在光追管道中添加一個新的階段,SER 能夠結合在同一程序上運行的光線,從而提升效率。
據英偉達所述,SER 在《賽博朋克 2077》遊戲中實現顯著的性能提升:
● Overdrive Mode —— 提升 44%
● Portal RTX —— 提升 29%
● Racer RTX —— 提升 20%
另一項 Ada Lovelace 架構創新,是英偉達為 RTX 40 系列帶來的 DMM 置換微網格:
作為針對幾何體的光追優化,第三代 RT 核心能夠理解並處理優化的 BVH 包圍體層次結構。
在改進 BVH 構建性能的同時,它還減少對存儲資源的需求,而且 Simplygon 和 Adobe 工具都將支持 DMM 。
最後,不透明度微貼圖可使 RT 核心更易理解不規則物體該如何受到光線的影響 —— 該功能通過包含預定不透明狀態(如半透明、不透明或未知)的蒙版而實現。
得益於此,OMM 可節省返回 SM 處理單元的時間、並在多項演示中將性能提升 10% 。至於和 DLSS 3、SER、DMM 和 OMM 相關的更多細節,還請耐心等待官方揭曉。