從歷史上看,英特爾將其積累的所有芯片知識用於推進摩爾定律,並將這些知識應用到其未來的CPU中。如今,其中一些高級處理器將用於阿貢國傢實驗室即將推出的“Aurora”超級計算機。
然而,要求苛刻的模擬和建模工作負載也能從 GPU 加速中獲益匪淺。認識到這一不斷增長的需求,英特爾著手設計和構建迄今為止最復雜的 GPU,並在非常緊迫的時間內完成。
這項努力的結果是,以前代號為“Ponte Vecchio”的英特爾 Max 系列 GPU將 1000 億個晶體管和 47 個區塊打包到五個工藝節點上。
除此之外,它們還包括兩項封裝創新,即 EMIB 2.5D 和 Foveros 3D 技術,以及將模塊堆疊在一起以獲得更高的處理器密度。
英特爾 Max 系列 GPU 產品經理 Duke Tallam 表示:“英特爾 Max 系列 GPU 的開發周期非常緊湊,因此將其變為現實就像挑戰我們的團隊一年蓋房子,明年建造摩天大樓。”
“迄今為止,GPU 是我們最復雜的處理器,代表英特爾矽產品的巨大飛躍。然而,整個封裝可以放在一個人的手掌中。”
眾多創新將 MAX 系列 GPU 推向市場
Max 系列 GPU 的巨大復雜性需要全球英特爾團隊成員的支持。在俄勒岡州和亞利桑那州的工廠完成技術開發過程後,矽片被運往英特爾在檳城的制造工廠進行大批量生產。
不過,要達到那個階段,需要創造性的解決方案,因為英特爾需要對其制造過程進行多次修改。首先,英特爾將芯片晶圓互連的間距縮小到 36μm,大約是人類頭發的寬度。
這是 Intel 晶圓廠或工廠成功使用過的最細粒度的pitch。
英特爾工廠還開發一種在工廠生產線上測試裸片的新方法——稱為單一堆疊裸片測試 (SSDT)。SSDT 確保在添加其他昂貴的組件(如基板 和高帶寬內存 (HBM) 芯片)之前,隻有功能正常的芯片才能在制造過程中向前推進 。
該公司還找到一種將管芯焊接到封裝上的新方法,將工藝能力提高 50%。最後,該小組開發先進的晶圓級組裝工藝,將可靠性提高十倍。
除 GPU 的技術復雜性之外,驗證過程還涉及在最少數量的樣本 GPU 上完成矽前測試的挑戰。
因此,該團隊不再依賴物理樣本進行測試,而是轉向虛擬模擬來展示虛擬芯片在真實場景中的表現。在其他地方,工程師采用其他創造性方法來加速測試過程,例如在從事該項目的許多團隊成員之間運行並行工作流的方法。
當被問及在兩年內將 GPU 推向市場所需的巨大努力時,英特爾的 Tallam 提出他的觀點。
“我們在制造處理器方面擁有半個多世紀的經驗,但設計 GPU 的復雜性和性能要求需要我們過去的所有知識和技能。”
Tallam 繼續說道,“Max 系列 GPU 有助於彌合當今已經令人難以置信的 HPC 系統與世界上少數能夠或將要達到 exascale 級性能的系統之間的差距。
因此,我們以意大利佛羅倫薩著名的橋梁命名 GPU 似乎是正確的。
Max 系列 GPU 橋既美觀又功能非凡。我們的團隊對更小規模的 GPU 也有同樣的看法。”
這些數據中心 GPU 與新推出的 Intel Xeon CPU Max 系列處理器的綜合能力將加速工作負載,從而在比以前更短的時間內揭示有價值的結果。阿貢國傢實驗室是 Max 系列的首批采用者之一。
其團隊計劃部署 60,000 個 Max 系列 GPU,平均分配給 10,000 個服務器刀片。
每個刀片還將依靠兩個 Intel Xeon CPU Max 系列處理器(這些是帶有 HBM 內存的“Sapphire Rapids”Xeons SP)來最大化 Aurora 的架構,以應對一些有史以來最重要的科學工作負載。
一旦 ANL 在其旗艦 Aurora 系統上部署完整的 Max 系列 GPU 和 CPU,其雙精度計算性能將超過 2 exaFLOPS。
研究人員已經計劃將所有計算能力用於一些最具挑戰性的科學問題,例如宇宙建模、推進基於聚變的安全能源解決方案、幫助實現醫學突破或更精確地預測颶風。
這些 GPU 代表英特爾雄心勃勃的多年IDM 2.0 產品領導、創新和長期客戶價值戰略的核心組成部分。
匯集一切
去年 11 月,馬來西亞的檳城組裝與測試 (PGAT) 員工慶祝首批 60,000 個 GPU 的制造。馬來西亞擁有英特爾最大的組裝和測試制造工廠,由四傢工廠組成。
檳城組裝與測試 (PGAT) 工廠經理 Wong Mei Fong 在她 28 年的英特爾職業生涯中經歷很多挑戰。盡管如此,與 GPU 的 1,500 名團隊成員的復雜性和協調性相比,它們都相形見絀。
PGAT 需要用通常與這種規模的項目相關的一半時間來滿足生產需求。為使這一切成為可能,其他團隊和工廠也支持這項工作。
“該產品的眾多復雜性是無與倫比的。由於時間緊迫,我們面臨的嚴峻挑戰變得更加困難,”Mei Fong 說。“盡管存在這些障礙,我們在合作夥伴組織的寶貴幫助下實現最初看似不可能的目標。”
寶貴的教訓
從開發和制造 GPU Max 系列中獲得的綜合經驗為未來的生產流程帶來新的見解,這將加速即將推出的處理器的交付。Tallum 指出,“我們對最新的處理器版本感到興奮,我們很自豪有機會為實現突破性科學盡自己的一份力量。”