AMD公佈GPU芯片新專利 推動優化遊戲中的著色器


AMD最近公佈一項專利,將渲染的負載分散到幾個GPU芯片組中。這樣一來,一個遊戲場景將被劃分為單獨的塊,並分配給小芯片,以優化遊戲中著色器的利用率。AMD公司公佈的新專利為該公司計劃在未來幾年內利用下一代GPU和CPU技術做什麼打開更多的視角。

在六月底,AMD有五十四項專利申請被披露。目前還不知道在公佈的五十多項專利中,哪些將在AMD的計劃中得到利用。專利中討論的應用詳細說明該公司在接下來幾年的做法。

社區成員@ETI1120在ComputerBase網站上註意到的一項申請,專利號為US20220207827,討論關鍵的圖像數據分兩個階段,將來自GPU的渲染負載有效地傳遞到許多小芯片上。CPU最初是在去年年底向美國專利局申請的。

當GPU上的圖像數據通過標準手段被光柵化時,著色器單元,也被稱為ALU會執行相同的任務,並為單個像素分配一個顏色名稱。反過來,在特定遊戲場景中的特定像素處發現的紋理多邊形被直接映射到像素上。最後,制定的任務將保持非典型的原則,隻通過位於不同像素的其他紋理進行區別。這種方法被稱為SIMD,即單指令-多數據。

對於目前的大多數遊戲來說,著色並不是GPU所承擔的唯一任務。相反,在最初的著色之後,還包括幾個後續的處理元素。例如,GPU將添加的動作是抗鋸齒、陰影和遊戲環境的遮擋。然而,光線追蹤是與著色同時進行的,創造一種新的計算方法。

當談到GPU控制當前遊戲中的圖形時,計算機所產生的負載被成倍地增加到成千上萬的計算單元。

在GPU上的遊戲中,這種計算負荷以一種有點理想的方式擴展到幾千個計算單元。這與處理器的不同之處在於,應用程序必須專門編寫以增加更多的核心。CPU調度器創造這個動作,將來自GPU的工作分割成更容易消化的任務,供應給計算單元處理,這被稱為分檔。遊戲中的圖像被渲染,然後被分成獨立的塊,這些塊包含設定的像素數量。該塊由圖形處理器的一個子單元計算,然後在那裡同步和創建。在這個動作之後,等待計算的像素被包含在一個塊中,直到最終使用顯卡的子單元。AMD在設計過程中對著色器的計算能力、內存帶寬和高速緩存的大小進行全盤考慮。

AMD在專利中解釋說,分割和連接要求在GPU的所有元素之間進行徹底和完整的數據連接,這就帶來一個問題。不位於芯片上的數據鏈接具有較高的延遲水平,導致該過程較慢。

CPU已經毫不費力地實現向芯片的這種過渡,因為它能夠同時幾個核心上發送任務,使其可用於芯片。GPU沒有提供同樣的靈活性,將其調度器與一個入門的雙核處理器相提並論。

AMD認識到這一需求,並試圖通過改變光柵化的管道,在幾個GPU小芯片之間發送任務,類似於CPU,來對這些問題做出回答。這需要先進的分層技術,該公司正在引入"兩級分層",也被稱為"混合分層"。分選被處理成兩個獨立的階段,而不是直接處理成逐個像素塊。第一步是計算方程,取一個三維環境,從原始圖像中創建一個二維圖像。這個階段被稱為頂點著色,在光柵化之前完成,這個過程在GPU的第一個芯片上是非常小的。一旦完成,遊戲場景開始被分檔,發展成粗大的分檔,並處理成單一的GPU芯片小,然後,柵格化和後期處理等常規任務就可以開始。

目前還不知道AMD打算什麼時候開始利用這個新工藝,或者它是否會被批準。然而,它讓我們看到更有效的GPU處理的未來。


相關推薦

2022-09-02

盡管驅動優化還有很長一段路要走,但英特爾圖形開發團隊和營銷部門,還是在持續努力地向大傢講述自傢ArcGraphics硬件的技術細節和性能數據。早前,TomPeterson和RyanShrout已在IFA2022期間接受PCGamer高級編輯JacobRidley的采訪。與此同

2023-11-10

序做任何修改,就能看到 M3 和 A17 Pro 的性能提升。這些芯片組利用動態緩存、硬件加速光線追蹤和硬件加速網格映射技術,使 GPU 的性能空前提高。動態著色器核心內存新一代著色器核心讓動態緩存成為可能。利用 A17 Pro 和 M3

2022-09-05

很多次,但是Intel顯卡目前的核心障礙不是硬件,而是驅動優化,bug有點多。那Intel的Arc顯卡到底是怎麼出現這樣的問題的呢?很久沒有什麼動靜的SemiAccurate網站創始人Charlie Demerjian最近寫篇很猛的爆料文章,指出Arc顯卡各種延期

2024-03-08

在同一事件中,GPU 制造商展示代號為 Volta 的未來架構。公佈的細節很少,普遍的假設是這將是另一款服務於英偉達所有市場的芯片。與此同時,AMD 也在做類似的事情,在其專註於遊戲的 Radeon 系列以及 FirePro 和 Radeon Sky 服務器

2022-09-21

中表示,得益於英偉達與臺積電的緊密合作,專為GPU制造優化的4N工藝讓Ada Lovelace架構能夠集成760億個晶體管和超過18000個CUDA核心,較上一代Ampere架構多70%,能耗比相較Ampere則提升一倍。圖 新一代Ada架構采用Ada架構的40系顯卡在

2022-08-13

比如在Angstronomics網站上,SkyJuice就分享與“Navi3X”有關的芯片詳情。盡管一些細節最早可追溯到2019-2020年,但我們還是可以借此機會再回顧一下。舊 Navi 31 渲染圖(Wild_C)首先是 Navi 31:● 芯片代號:gfx1100 / Plum Bonito● 小芯片

2022-08-13

最近一段時間Intel入局顯卡市場引發大傢對驅動優化問題的關心,這個事比硬件架構更影響體驗,做出一個好驅動不是那麼容易的,AMD剛剛發佈Radeon22.8.1驅動,雖然增加對2款新遊戲的優化,但是被吐槽很久的黑屏問題依然存在。

2024-03-25

開基於DirectSR的"超級分辨率"切換。在遊戲開發者大會(GDC2024)活動期間,微軟分享一些關於DirectSR如何讓遊戲開發者輕松提升遊戲分辨率的有趣花絮。遊戲開發人員通常會以較低分辨率渲染某些元素,如反射

2022-08-06

圈可點,尤其是AV1編碼很有優勢,但是最大的麻煩還是驅動優化,A380在實際遊戲中的表現被多傢外媒形容為糟糕,表現不讓人滿意。對於這個問題,Intel高管Tom Petersen日前在采訪中做解釋,他尤其提到基於DX9、DX11這樣的老遊戲

2024-02-07

斯·普利姆創辦英偉達。早期,英偉達的業務專註於圖形芯片,主要服務於電子遊戲市場。1999年,英偉達在納斯達克掛牌上市。沒過多久,它就推出廣為人知的GeForce系列。在《雷神之錘》等視頻遊戲的推動下,GeForce系列很快成

2022-07-01

一變 每年提升兩位數性能】有趣的是,Arm這次很大方地公佈瞭未來兩年的路線圖。明年的TCS23,超大核CPU升級為CXC23(預計命名Cortex-X4),大核、小核分別升級為Hunter、Hayes,DSU互聯單元升級為Hayden,旗艦GPU則升級為Titan。後年的TCS2

2022-08-30

A 3 GPU 的關鍵特性如下:● 采用 5nm 制程節點● 先進的小芯片封裝工藝● 重新設計的計算單元(CU)架構● 優化的圖形管道● 新一代 AMD 無限緩存(Infinity Cache)● >50% Perf/Watt vs RDNA 2其中 Navi 31“Plum Bonito”GPU 有望率先上市,

2022-09-21

電N4 4nm定制工藝技術,能耗比提升2倍。再看產品,這次公佈最核心的一些規格參數——RTX 4090:旗艦產品,這一代首發,集成760億個晶體管、16384個CUDA核心,搭配美光的24GB GDDR6X顯存。功耗和RTX 3090 Ti一樣都是450W,但號稱遊戲性

2022-06-29

來的挑戰,在於需要在移動 SoC 上占用大量功率、能耗和芯片面積。不過 Immortalis-G715 的光追部分,僅占用瞭 4% 的著色器核心區域,但仍通過硬件加速實現瞭 300% 以上的性能提升。目前尚不清楚較軟件方案提升 3 倍的光追加速體