9月20日的GTC活動上,英偉達CEO黃仁勛在演講中發佈萬眾矚目的英偉達新一代遊戲顯卡RTX40系列。本次英偉達共發佈三款顯卡,分別是RTX40系旗艦顯卡RTX4090與定位高端的RTX408016GB、RTX408012GB。
RTX 40系列顯卡采用新一代RTX架構,計算能力再次實現跨越式發展。而光追技術的全新升級與DLSS3的加入,也為遊戲玩傢帶來全新的升級體驗。
RTX 4090顯卡將在10月12日上市,而RTX 4080顯卡則將在11月上市。
加量也加價,40系顯卡性能、價格雙“越級”
RTX4090采用全新的第三代RTX架構,並使用臺積電4N工藝制造。
新一代RTX以世界上第一位計算機程序員Ada Lovelace的名字命名,黃仁勛在演講中表示,得益於英偉達與臺積電的緊密合作,專為GPU制造優化的4N工藝讓Ada Lovelace架構能夠集成760億個晶體管和超過18000個CUDA核心,較上一代Ampere架構多70%,能耗比相較Ampere則提升一倍。
圖 新一代Ada架構
采用Ada架構的40系顯卡在性能表現上遠遠超過前輩30系顯卡。
旗艦定位的RTX 4090集成760億個晶體管、16384個CUDA核心,並擁有24GB顯存。
英偉達表示,在強大硬件指標的加持下,RTX 4090顯卡即使在4K分辨率下,依然可以獲得超過100FPS的流暢遊戲體驗。
能效方面,RTX 4090功率為450W,與RTX 3090Ti保持一致,但英偉達稱在同樣功率下,4090的遊戲表現較RTX 3090Ti提升一倍。
定位低一檔的RTX 4080則有16GB與12GB兩個顯存版本,16GB版本集成9728個DUDA核心。英偉達稱RTX 4080 16GB的遊戲性能兩倍於RTX 3080,並超過上一代旗艦RTX 3090 Ti。
而12GB版本的RTX 4080則集成7680個CUDA核心,理論性能也超越上一代旗艦RTX 3090 Ti。
全新架構還搭載Opacity Micromap引擎,將光線追蹤的Alpha-Test集合性能提升2倍。全新的Micro-Mesh引擎則能夠在不帶來更多的BVH構建和存儲資源消耗的前提下提升圖形的豐富度。
最後,全新Tensor Core新增Hooper FP8 Transformer Engine可以提供1.4 petaFLOPS張量處理性能。在性能獲得巨大升級的同時,這一代英偉達遊戲顯卡的價格也再創新高。
RTX 4090建議零售價為12999人民幣起,相比上一代RTX 3090 11999元的其售價漲價1000元。
圖 RTX 40系列顯卡售價
而RTX 4080價格則上探到9499元,相較上一代RTX 3080 5499元的起售價可謂完成“消費升級”。即使結合英偉達本代顯卡將沒有RTX 4080Ti的傳聞,RTX 4080 16GB的其售價也比上一代同定位的RTX 3080 Ti的9499元略有提價。
更低配置的RTX 4080 12GB的其售價也高達7199元,與上一代同定位的RTX 3070Ti的4499元售價也漲勢兇猛。
光追再升級,遊戲中AI“偷天換日”
本次RTX 40系列顯卡最重要的升級之一就是對光線追蹤技術的升級。
RTX系列顯卡最初問世就以光線追蹤為特色功能,本次40系的更新更是“牙膏擠爆”,正如英偉達CEO黃仁勛所說:“英偉達重新定義圖形。”
新的Ada Lovelace架構具有高達90TFLOPs的著色器能力,吞吐量超過上一代產品兩倍。除此之外,Ada架構的SM多單元流處理器還使用著色器重排序技術(SER),可實現對任務的實時重新調度。黃仁勛強調這項技術對GPU來說是革命性的,原理上與CPU的亂序執行技術類似。
對於這項技術,黃仁勛在演講中解釋道,光線追蹤的工作負載需要不同的線程處理,不同著色器之間很難合並工作,SER技術則能夠即時安排著色器負載,從而提高執行效率,更好地利用GPU資源,打造更好的光線追蹤效果。
圖 SER技術工作原理
這項技術能夠讓英偉達顯卡光線追蹤性能提升2-3倍,整體遊戲性能提升25%。
在提升計算能力之外,英偉達還通過多種方式提升終端遊戲體驗。在演講中,黃仁勛表示,和加速計算一樣,計算機圖形的也是一項全棧挑戰。要實現突破還需要在架構、設計和算法上創新。
此前在RTX顯卡上始終扮演著重要角色的DLSS技術本次也迎來重大更新。
在RTX顯卡上,DLSS技術一直是光線追蹤技術的重要“搭檔”:光線追蹤模擬出更真實、更貼近現實效果的遊戲場景,DLSS技術則利用AI算法降低模擬這樣的真實物理環境所需要的計算量,保證用戶流暢的遊戲體驗。
這次,第三代DLSS技術同RTX 40系顯卡一同登場,並帶來開創性的光學多幀生成功能。
與之前最大的不同在於,第三代DLSS技術生成的不再是像素,而是全面的畫面幀。
基於Ada Lovelace架構的新光流加速器,第三代DLSS技術可以分析兩幀連續的遊戲圖像,並向神經網絡輸入像素級的從幀到幀的運動方向和速度信息,此後神經網絡模型將據此計算出中間幀。
這樣的中間幀由神經網絡計算生成,不再涉及圖形渲染,完全獨立於遊戲。這能夠大大減輕遊戲中即時演算的運算量。
通俗的講,遊戲中的畫面是由GPU這個“畫傢“通過算力的”畫筆“創造的,DLSS3技術能在兩張畫作之間插入一張AI生成的”照片“,從而徹底解放GPU”畫傢“的雙手。
英偉達表示第三代DLSS技術相較於單純渲染的方式可以將遊戲性能提高4倍。
黃仁勛表示,DLSS 3能夠為Ada GPU帶來遠高於CPU可計算的幀率,從而讓一些對CPU要求較高的遊戲也從中受益。
在現場,英偉達展示兩款對CPU要求較高的遊戲,在開啟DLSS3後,《賽博朋克2077》與《微軟模擬飛行》的幀率增加都超過一倍,達到90幀以上。
圖 開啟DLSS3前後,《微軟模擬飛行》幀率變化
《傳送門》連接過往與將來,英偉達沖向元宇宙
遊戲,是RTX 40系列發佈時一個重要話題。
在發佈40系顯卡的同時,本次英偉達還頗有復古精神的帶來經典遊戲《傳送門》重制版。
這款被稱為《傳送門RTX》的遊戲,實際上是英偉達基於其元宇宙創作平臺onmiverse創建的一個mod。
圖 使用光追技術的《傳送門》重制版
英偉達巧妙地用《傳送門》,連接起過去和未來。
正如這一經典遊戲的玩法:開啟傳送門,走向另一端。
在英偉達看來,傳送門的另一端無疑是屬於元宇宙的世界。
黃仁勛表示,mod是一種受眾龐大的遊戲文化,各種遊戲mod每年下載量已經突破數十億次。在10款最熱門的競技遊戲中,有9款都能見到mod的身影。
英偉達為遊戲mod設計者打造一款名為RTX Remix的Ominverse應用。
基於該工具,遊戲開發者可以為各種經典遊戲制作mod添加RTX光追效果。
基於該工具,mod制作者需要將遊戲導入USD中,然後使用modding工具來創建光線追蹤mod,並導出至RTX渲染器。該工具還使用AI技術,以提升mod材質的質感。
英偉達在幾年前就已經創建名為Onmiverse的元宇宙創意平臺,讓元宇宙開發者可以通過這個3D平臺互相連接並共同協作。
無論是RTX 40系列顯卡更強的GPU算力,還是更真實的光追效果,都無疑將會為元宇宙的生態貢獻更強的力量。
在老黃演講的開頭,是一段RacerX演示的demo。RacerX是基於Omniverse構建的全交互式仿真演示,其中所有的基於現實物理規律,所有光照、反射和折射則采用光線追蹤技術。
這也許昭示著英偉達眼中的未來:在更加強大的顯卡性能與AI能力加持下的更加真實的遊戲體驗和元宇宙場景。