蘋果官方幻燈片詳解A17 Pro和M3的三項GPU增強功能的實際作用


使用MetalAPI的應用程序和遊戲以AppleSiliconGPU的特定功能為目標,M3和A17Pro的並行處理能力得到顯著提升,使其性能更上一層樓。蘋果公司發佈關於這些新的AppleSiliconGPU功能的開發者講座,詳細介紹實現改進效果的具體過程。該視頻介紹大量技術細節,但也提供足夠的基本解釋。

57221-116363-M3-family-2-xl.jpg

使用 Metal API 構建應用程序的開發者無需對其應用程序做任何修改,就能看到 M3 和 A17 Pro 的性能提升。這些芯片組利用動態緩存、硬件加速光線追蹤和硬件加速網格映射技術,使 GPU 的性能空前提高。

動態著色器核心內存

新一代著色器核心讓動態緩存成為可能。利用 A17 Pro 和 M3 中的最新 GPU 內核,這些著色器可以比以前更高效地並行運行,從而大幅提高輸出性能。

57221-116365-IMG_4066-xl.jpg

虛線表示浪費的寄存器內存

通常情況下,GPU 隻能根據一個已執行動作中帶寬最高的進程來分配寄存器內存,並持續該動作。因此,如果一個動作的某個部分比其他部分需要更多的寄存器內存,那麼該動作的某個進程就會占用更多的寄存器內存。

動態高速緩存允許 GPU 為其正在執行的每個操作精確分配適量的寄存器內存。以前不可用的寄存器內存被釋放出來,從而可以並行執行更多的著色器任務。

靈活的片上內存

以前,片上內存會為寄存器、線程組和帶有緩沖緩存的磁貼內存分配固定的內存。這意味著,如果某項操作使用的內存類型多於另一種,就會有很大一部分內存被閑置。

57221-116366-IMG_4067-xl.jpg

整個芯片內存都可用作高速緩存

有靈活的片上內存,所有片上內存都是緩存,可用於任何內存類型。因此,嚴重依賴線程組內存的操作可以利用整個片上內存,甚至溢出到主內存中。

著色器內核可動態調整片上內存占用率,以最大限度地提高性能。這意味著開發人員可以花更少的時間來優化占用率。

著色器內核的高性能 ALU 管線

Apple 建議開發人員在程序中執行 FP16 數學運算,但高性能 ALU 可並行執行整數、FP32 和 FP16 的不同組合。指令在並行執行的不同操作中執行,這意味著 ALU 利用率會隨著占用率的提高而提高。

57221-116367-IMG_4068-xl.jpg

利用高性能 ALU 流水線增加並行操作

基本上,如果不同的操作包含相同的 FP32 或 FP16 指令,而這些指令將在不同的時間點執行,則可以重疊執行以提高並行性。

硬件加速圖形流水線

硬件加速的光線追蹤可將重要的交點計算從 GPU 功能中移除,從而大大加快處理速度。由於部分計算由硬件完成,因此可以並行進行更多操作,從而通過硬件組件加速光線追蹤。

57221-116368-IMG_4069-xl.jpg

硬件加速取代片上進程

硬件加速網格著色采用類似的方法。它將幾何計算流水線的中間部分交給一個專用單元,從而實現更多並行操作。

這些都是復雜的系統,不是幾段文字就能說清楚的。我們建議大傢觀看視頻《Explore GPU advancements in M3 and A17 Pro》解所有細節,並牢記一點--A17 Pro 和 M3 專註於計算並行性,以加快任務執行速度。

https://developer.apple.com/videos/play/tech-talks/111375?time=39

M3 可用於 MacBook Pro 和 24 英寸 iMac。A17 Pro 可用於 iPhone 15 Pro。


相關推薦

2023-11-13

蘋果的M3系列芯片已開始進入PassMark的CPU基準數據庫,並延續其前輩在單線程工作負載方面領先於所有競爭對手的傳統。不幸的是,對於蘋果來說,它的M3Max處理器沒有機會與英特爾和AMD的旗艦產品抗衡,當然,在多線程工作負載

2023-10-31

蘋果今天早間最新發佈的M3Pro采用最新的3nm技術量產,使芯片組具有令人難以置信的每瓦性能屬性,同時功耗低於同類芯片組。然而,盡管有這些改進,我們在與M2Pro的規格對比中發現,蘋果在某些方面降低這種定制芯片的性能

2023-11-21

幻燈片顯示,Battlemage 的峰值性能可達 3.8 TFLOPS,相當於蘋果的 M2 SoC。就行業能力而言,Lunar Lake-MX CPU 可能會成為移動行業的一個重要時刻,這主要是因為該陣容有望帶來重大的代際變化。Lunar Lake-MX 系列處理器的發佈日期尚未

2023-08-08

快科技8月7日消息,今年蘋果iPhone 15系列用的A17處理器會首發3nm工藝,後續將要發佈的M3系列芯片也將會采用臺積電3nm,蘋果將是今年臺積電唯一的3nm客戶,這一速度領先對手Intel和AMD。據爆料,蘋果將在10月份推出M3系列芯片。

2023-10-31

在周一晚上的發佈會上,蘋果公司發佈M3、M3Pro和M3Max,性能比初代的M1芯片最多提高80%。新一代芯片采用3納米制程,在GPU動態緩存方面開創行業先河,允許系統在最需要的時候保留資源。這項新技術將提供持續穩定的體驗,即使

2023-11-02

的情況下,新一代AppleSilicon的性能甚至沒有比M2提升10%。蘋果公司最先進的 3nm 架構可能讓該公司在 M3 上采用運行時鐘速度更高的性能內核,但在 GPU 方面,情況就完全不同,但這可能是有原因的。在 GFXBench 的 4K Aztec Ruins High Tier

2024-04-25

。測試結果表明,高通公司最新、最先進的芯片繼續超越蘋果公司的 M3,但尚未超越更高端的芯片組。Surface Laptop 6 在 Geekbench 6 中的標題為"OEMBR OEMBR Product Name MFG",驍龍 X Elite 的 CPU 配置包括 8 個性能核心和 4 個能效核心

2023-06-12

快科技6月11日消息,上周的WWDC大會上,蘋果發佈15寸MacBook Air筆記本,用上M2處理器,國內售價10499元起。此前傳聞這次大會上蘋果會首發M3處理器,然而實際上發佈的是M2 Ultra,還是5nm工藝的,M3會使用臺積電3nm工藝,但是今年讓

2023-09-14

蘋果於9月13日發佈年度旗艦新品iPhone 15系列,引起國內科技圈的廣泛關註。前魅族高管李楠對這款新機進行評價。他認為,iPhone 15 Pro系列可以升級,因為該系列具備三個亮點。首先,iPhone 15 Pro配備鈦合金邊框,這意味著它可以

2023-11-04

蘋果公司的M3Max在Geekbench6的多核測試中擊敗M2Ultra,給人留下美好的第一印象,盡管它的CPU內核數量少於專為MacStudio和MacPro等臺式機和工作站設計的SoC。不過,新的Metal分數(測試蘋果A系列和M系列芯片在圖形要求苛刻的情況下的

2023-11-12

蘋果公司是在2020年的雙十一,亮出的M1芯片,算下來剛好是三年。所以蘋果的“矽計劃”(AppleSilicon)也剛好推出三年,當年的M1亮相,完全是大殺四方的屠龍少年形象,5nm制程、160億晶體管,並直接將Mac電腦的CPU性能提升3.5倍

2022-09-14

蘋果的芯片正準備邁向3nm制程節點,不過蘋果在具體工藝的選擇上仍有待商榷。雖然臺積電(TSMC)計劃在今年下半年量產第一代N3工藝,同時英特爾因MeteorLake延期空出產能,不過蘋果似乎有所保留,並沒有選擇大規模下單。據Ni

2023-10-10

。根據泄露的基準測試成績,這款SoC的性能非常出色,但與蘋果最新的A17Pro不同的是,高通采用更為成熟的N4P工藝。 盡管高通選擇使用最先進的芯片制造工藝,但第三代驍龍8似乎沒有受到太大的影響。據網友透露,與A17Pro相比,第三代

2022-07-17

英特爾有史以來第一款桌面顯卡A380的官方基準測試數據最近泄露之後,又一份ArcA系列桌面GPU的完整官方陣容列表被公佈出來。這包括價格和性能定位、TDP和內存配置。這是一份英特爾與他們臺灣地區的合作夥伴分享的文件,它