FPGA實時光追演示:Artix平臺效能是銳龍R9-4900H CPU軟解的50倍


盡管在傳統硬件仿真領域,“可編程邏輯門陣列”(FPGA)的名氣要更高一些。但近期一些成功的FPGA光追遊戲運算演示,再次吸引許多人的目光,因為這通常是圖形處理器(GPU)的優勢領域。TechSpot報道稱,來自兩位開發者的新工作流工具,使得一枚普通的FPGA、能夠實現較傳統x86處理器更驚人的效率提升,為多個行業的節能運營開辟新經驗。

1.jpg

Arty A7 FPGA 開發板資料圖

本次演示選擇一個在棋盤上彈跳的閃亮球形物體,且它用到實時光線追蹤功能 —— 之前沒人指望過一款中型 FPGA 芯片能夠輕松應對此類應用。

不過更值得稱道的,還是 FPGA 運行遊戲所消耗的能量,遠低於功能更強大的 AMD 筆記本電腦處理器。

2.jpg

在 Artix 7 100T 硬件上,Victor Suarez Rovere 和 Julian Kemmerer 借助他們的 CflexHDL / PipelineC 工具,用 C 語言構建這一演示所需的 FPGA 固件代碼。

作為比較,兩位開發者搬來 AMD 銳龍 R9-4900H 平臺、並編譯基於 CPU 軟解(不使用集成的核顯)的相同演示。

兩者均在 1080p 下以大約 60 FPS 的幀速率運行遊戲,但需要截然不同的性能配置文件來完成任務。

Sphery vs. Shapes - Victor Suarez Rovere(via)

據悉,Artix 平臺采用 28nm 節點工藝的 FPGA 芯片,主頻為 148 MHz、具有約 10 萬個邏輯元件。

相比之下,銳龍 R9-4900H 是一款 8C / 16T 的 7nm 處理器。開發人員在 4.2 GHz 的加速頻率附近,調用該芯片的所有核心線程。

Rovere 和 Kemmerer 估計,Artix 的晶體管數量,大約隻有這枚銳龍移動芯片的 1 / 15 。

3.webp

盡管硬件規模上存在相當大的差距,但 FPGA 演示僅消耗 660 mW 的功率。而且就算沒用到主動式散熱解決方案,該芯片仍“幾乎沒有發熱”。

另一方面,x86 架構的銳龍 R9-4900H 的功耗達到 33 W —— 不僅 50 倍於 FPGA,風扇也在 88℃ 的高溫下猛轉以實現相同的性能。

Rovere 和 Kemmerer 據此推測,7nm FPGA 芯片可進一步將能效差距擴大至 6 倍、同時功耗低至銳龍 R9-4900H 的 1/300 。

GitHub.png

當然,我們不該徹底無視 APU 上的核芯顯卡、或在搭配專用獨顯(GPU 加速卡)下可實現的更高效能。

但這麼做仍無法消除與 Artix 平臺的差距,更別提采用更先進的 FPGA 解決方案來發起挑戰。

最後,感興趣的朋友,可移步至 PipelineC-Graphics 的 GitHub 項目主頁(白皮書),以獲知更多細節。


相關推薦

2022-09-03

LVMpipe啟用AVX-512支持。至於這麼做的原因,主要是AMD在Zen4銳龍7000系列臺式處理器上引入AVX-512指令集。通過驅動方面的優化,Luo希望為R9-7950X等CPU帶來最佳性能增益。有趣的是,盡管 Intel 多年來一直在力推 AVX-512,但在 12 代酷睿

2022-09-13

已經發佈最新版本Releasev-2022.Q3.4,終於加入對64-bitVulkanRT實時光線追蹤的支持。產品支持方面,僅限RX 6000系列獨立顯卡,不支持銳龍6000H/U中集成的Radeon 680M/660M。至於實際效果如何,發佈說明裡並未提及,需要自行體驗。此外,

2023-12-07

以獲得成本的效率提升。如今,AMD又全新打造Ryzen AI軟件平臺,支持TensorFlow、PyTorch、ONNX等眼下最為火熱的AI模型。開發者可以藉此充分挖掘Ryzen AI引擎的性能,更輕松地部署生成式等AI應用和加速。為鼓勵開發者創新,AMD還發起

2023-01-05

所謂的“XDNA”適應性架構,配備4個獨立的並發AI流,可實時處理多任務,相比單個AI流的響應速度可提升超過35%。順帶一提,AMD還準備一款名為“Alveo V70”的獨立AI加速卡,也是XDNA架構,專門用於AI推理,半高式單插槽設計,

2022-09-20

CES上發佈的產品,明年初的CES上發佈的新品並不難猜,還是銳龍7000傢族的,主要的移動版。AMD的移動版銳龍7000分為兩個系列,一個是代號Phoenix鳳凰系列,銳龍6000H/U系列的繼任者,集成Zen4 CPU架構、RDNA3 GPU架構,功耗35~45W,支持

2023-04-18

年初,AMD正式發佈銳龍7000系列移動平臺,包括五個不同系列,隻有高端的銳龍7045HX、銳龍7040HS系列才是Zen4 CPU、RDNA3 GPU雙新架構,制造工藝分別為5nm、4nm,而中低端的7035、7030、7020系列都是老架構的新馬甲。官方最初公佈的上市

2023-04-22

差距不大,但是後者可以解鎖到140W,差距就拉大到19%。光追遊戲中,更是天壤之別,差距達到可怕的38-50%。ComputeBase還指出,雖然兩款卡都是8GB顯存,但對於RX 7600S來說更是瓶頸,遊戲中往往會吃掉更多顯存。

2022-08-30

景,這更有代表性。當然,更重要的意義實際上是在移動平臺,別忘明年初AMD還會發佈移動版銳龍7000,有,一個是Phoenix鳳凰系列,4nm工藝,銳龍6000H/U系列的繼任者,功耗35~45W,支持LPDDR5及PCIe 5.0,面向20mm厚度以內的輕薄本。一

2022-09-21

GPU架構,在性能、效率上都實現巨大的代際飛躍,無論是實時光線追蹤,還是AI神經網絡渲染,都可以說開啟新時代。RTX 40系列的主要創新提升有:1、流式多處理器(SM)著色器能力高達83TFlops(83萬億次運算每秒),吞吐量超過上一

2023-11-24

們獲悉銳龍8040系列的全線型號命名,毫無意外。最高端是銳龍9 8940H,和現在的銳龍9 7640H一模一樣,還是8核心16線程、Radeon 780M 20單元核顯,甚至頻率都是4.0-5.2GHz。難道頻率都沒有提升?按理說不應該,不然就是純粹改個名字。

2022-09-23

》-- 103 FPS《戰錘 40K:暗潮》-- 138 FPS《虛幻引擎 5 - Lyra》光追演示 -- 155 FPS《F1 22》光追演示 -- 204 FPS《Unity Enemies》光追演示-- 89 FPS《賽博朋克 2077》光追演示-- 141 FPS明日遊戲:《賽博朋克 2077》光追最高檔 / Overdrive 模式 -- 90 FPS

2022-07-07

封面(來自:Hardware Unboxed / YouTube)首先回顧下兩套芯片平臺的規格,上月發佈的 Apple M2 SoC 采用臺積電 5nm 先進工藝,擁有 200 億個晶體管 —— 較 M1 SoC 增加 25% 。盡管 CPU 仍是 8 核,但核心本身有所升級。結合更大的緩存和效

2023-11-14

。同時,新工作站支持安裝3個NVIDIA RTX 6000 Ada GPU,可進行實時光線追蹤或視頻渲染、模擬或計算機輔助設計,AR/VR內容創作和高級AI模型開發。此外,P8工作站最多可容納7個支持RAID的M.2 PCIe Gen 4 SSD,或容納3個大容量HDD,支持8通

2022-09-01

,DDR5-5200 @ CL28 的內存套件,也將非常適合 Zen 4 銳龍 7000 平臺選用。有趣的是,據微星(MSI)主板工程師 Toppc Lin 透露(傳送門),EXPO 內存套件將與 Intel XMP 配置文件完全兼容。不過在此基礎上,各個廠傢推出的 EXPO 內存模組,