5種工藝1000億晶體管 Intel造出有史以來最復雜的芯片?


從歷史上看,英特爾將其積累的所有芯片知識用於推進摩爾定律,並將這些知識應用到其未來的CPU中。如今,其中一些高級處理器將用於阿貢國傢實驗室即將推出的“Aurora”超級計算機。

然而,要求苛刻的模擬和建模工作負載也能從 GPU 加速中獲益匪淺。認識到這一不斷增長的需求,英特爾著手設計和構建迄今為止最復雜的 GPU,並在非常緊迫的時間內完成。

這項努力的結果是,以前代號為“Ponte Vecchio”的英特爾 Max 系列 GPU將 1000 億個晶體管和 47 個區塊打包到五個工藝節點上。

除此之外,它們還包括兩項封裝創新,即 EMIB 2.5D  和 Foveros 3D 技術,以及將模塊堆疊在一起以獲得更高的處理器密度。

英特爾 Max 系列 GPU 產品經理 Duke Tallam 表示:“英特爾 Max 系列 GPU 的開發周期非常緊湊,因此將其變為現實就像挑戰我們的團隊一年蓋房子,明年建造摩天大樓。”

“迄今為止,GPU 是我們最復雜的處理器,代表英特爾矽產品的巨大飛躍。然而,整個封裝可以放在一個人的手掌中。”

眾多創新將 MAX 系列 GPU 推向市場

Max 系列 GPU 的巨大復雜性需要全球英特爾團隊成員的支持。在俄勒岡州和亞利桑那州的工廠完成技術開發過程後,矽片被運往英特爾在檳城的制造工廠進行大批量生產。

不過,要達到那個階段,需要創造性的解決方案,因為英特爾需要對其制造過程進行多次修改。首先,英特爾將芯片晶圓互連的間距縮小到 36μm,大約是人類頭發的寬度。

這是 Intel 晶圓廠或工廠成功使用過的最細粒度的pitch。

英特爾工廠還開發一種在工廠生產線上測試裸片的新方法——稱為單一堆疊裸片測試 (SSDT)。SSDT 確保在添加其他昂貴的組件(如基板 和高帶寬內存 (HBM) 芯片)之前,隻有功能正常的芯片才能在制造過程中向前推進 。

該公司還找到一種將管芯焊接到封裝上的新方法,將工藝能力提高 50%。最後,該小組開發先進的晶圓級組裝工藝,將可靠性提高十倍。

除 GPU 的技術復雜性之外,驗證過程還涉及在最少數量的樣本 GPU 上完成矽前測試的挑戰。

因此,該團隊不再依賴物理樣本進行測試,而是轉向虛擬模擬來展示虛擬芯片在真實場景中的表現。在其他地方,工程師采用其他創造性方法來加速測試過程,例如在從事該項目的許多團隊成員之間運行並行工作流的方法。

當被問及在兩年內將 GPU 推向市場所需的巨大努力時,英特爾的 Tallam 提出他的觀點。

“我們在制造處理器方面擁有半個多世紀的經驗,但設計 GPU 的復雜性和性能要求需要我們過去的所有知識和技能。”

Tallam 繼續說道,“Max 系列 GPU 有助於彌合當今已經令人難以置信的 HPC 系統與世界上少數能夠或將要達到 exascale 級性能的系統之間的差距。

因此,我們以意大利佛羅倫薩著名的橋梁命名 GPU 似乎是正確的。

Max 系列 GPU 橋既美觀又功能非凡。我們的團隊對更小規模的 GPU 也有同樣的看法。”

這些數據中心 GPU 與新推出的 Intel Xeon CPU Max 系列處理器的綜合能力將加速工作負載,從而在比以前更短的時間內揭示有價值的結果。阿貢國傢實驗室是 Max 系列的首批采用者之一。

其團隊計劃部署 60,000 個 Max 系列 GPU,平均分配給 10,000 個服務器刀片。

每個刀片還將依靠兩個 Intel Xeon CPU Max 系列處理器(這些是帶有 HBM 內存的“Sapphire Rapids”Xeons SP)來最大化 Aurora 的架構,以應對一些有史以來最重要的科學工作負載。

一旦 ANL 在其旗艦 Aurora 系統上部署完整的 Max 系列 GPU 和 CPU,其雙精度計算性能將超過 2 exaFLOPS。

研究人員已經計劃將所有計算能力用於一些最具挑戰性的科學問題,例如宇宙建模、推進基於聚變的安全能源解決方案、幫助實現醫學突破或更精確地預測颶風。

這些 GPU 代表英特爾雄心勃勃的多年IDM 2.0 產品領導、創新和長期客戶價值戰略的核心組成部分。

匯集一切

去年 11 月,馬來西亞的檳城組裝與測試 (PGAT) 員工慶祝首批 60,000 個 GPU 的制造。馬來西亞擁有英特爾最大的組裝和測試制造工廠,由四傢工廠組成。

檳城組裝與測試 (PGAT) 工廠經理 Wong Mei Fong 在她 28 年的英特爾職業生涯中經歷很多挑戰。盡管如此,與 GPU 的 1,500 名團隊成員的復雜性和協調性相比,它們都相形見絀。

PGAT 需要用通常與這種規模的項目相關的一半時間來滿足生產需求。為使這一切成為可能,其他團隊和工廠也支持這項工作。

“該產品的眾多復雜性是無與倫比的。由於時間緊迫,我們面臨的嚴峻挑戰變得更加困難,”Mei Fong 說。“盡管存在這些障礙,我們在合作夥伴組織的寶貴幫助下實現最初看似不可能的目標。”

寶貴的教訓

從開發和制造 GPU Max 系列中獲得的綜合經驗為未來的生產流程帶來新的見解,這將加速即將推出的處理器的交付。Tallum 指出,“我們對最新的處理器版本感到興奮,我們很自豪有機會為實現突破性科學盡自己的一份力量。”


相關推薦

2023-01-05

數據中心加速卡。Instinct MI300也采用小芯片設計,涉及多種工藝,其中5nm工藝的小芯片有9塊,6nm工藝的小芯片有4塊,還有128GB HBM3顯存。整個Instinct MI300顯卡擁有高達1460億晶體管,這是當前最復雜、集成度最高的加速卡,NVIDIA的H

2022-08-29

的FinFET晶體管技術已經到極限,Intel將會在2024年量產的20A工藝上放棄FinFET技術,轉向RibbonFET及PowerVIA等下一代技術。根據Intel所說,RibbonFET是Intel對Gate All Around晶體管的實現,它將成為公司自2011年率先推出FinFET以來的首個全新晶

2022-08-09

際旗艦產品。根據介紹,壁仞科技BR100芯片采用臺積電7nm工藝制造、2.5DCoWoS封裝技術、Chiplet小芯片技術,集成多達770億晶體管,規模上堪比人類大腦神經細胞,已經非常接近800億個晶體管的NVIDIAGH100計算核心。性能方面,INT8整數

2022-11-07

在EUV光刻工藝上,Intel此前承認他們過去翻錯,讓臺積電、三星搶先,畢竟Intel是最早研發EUV工藝的半導體公司之一,現在Intel可以追上來,今年底就首次使用EUV的Intel 4工藝就會規模量產。Intel 4就是之前的Intel 7nm工藝,也是Intel

2023-06-01

息,據外媒報道,蘋果的混合現實(MR)頭顯將是該公司有史以來最復雜的硬件產品,其獨特的曲面設計給生產帶來前所未有的挑戰。長期以來,一直有傳言稱蘋果正在開發自己的MR頭顯,但該公司至今沒有證實它的存在。傳言

2024-03-14

的前提下性能翻一番。2019年的第一代WSE-1基於臺積電16nm工藝,面積46225平方毫米,晶體管1.2萬億個,擁有40萬個AI核心、18GBSRAM緩存,支持9PB/s內存帶寬、100Pb/s互連帶寬,功耗高達15千瓦。2021年的第二代WSE-2升級臺積電7nm工藝,面

2022-07-05

ntel要推出的13代酷睿RaptorLake還是12代酷睿的改進版,制程工藝也是Intel7,隻是再多8個效能核,總計24核32線程,繼續兼容DDR5/DDR4、LGA1700平臺等。明年就要輪到14代酷睿,代號MeteorLake流星湖,這一代架構改進很大,第一次采用非單

2023-02-03

推出。MI300采用多芯片、多IP整合封裝設計,5nm先進制造工藝,晶體管數量多達瘋狂的1460億個!它同時集成CDNA3架構的GPU單元(具體核心數量未公開)、Zen4架構的24個CPU核心、大容量的Infinity Cache無限緩存,還有8192-bit位寬、128GB容量

2023-03-27

芯片。MI300采用多芯片、多IP整合封裝設計,5nm先進制造工藝,晶體管數量多達瘋狂的1460億個!它同時集成CDNA3架構的GPU單元(具體核心數量未公開)、Zen4架構的24個CPU核心、大容量的Infinity Cache無限緩存,還有8192-bit位寬、128GB容量

2023-04-21

破。美國芯片公司Marvell表示,公司基於臺積電3納米(3nm)工藝打造的數據中心芯片正式發佈。據Marvell介紹,公司在該節點中的業界首創矽構建模塊包括 112G XSR SerDes(串行器/解串行器)、Long Reach SerDes、PCIe Gen 6 / CXL 3.0 SerDes 和 240

2022-09-28

A制程 PDK 0.3版本現在已經被早期設計客戶采用(PDK也就是工藝設計工具包),測試芯片正在設計中,將於年底流片。“摩爾定律——至少在未來的十年裡依然有效。英特爾將一往無前,挖掘元素周期表中的無限可能,持續釋放矽

2023-03-07

論消費級銳龍,還是服務器級霄龍,CCD部分都是臺積電5nm工藝,最多8個核心。其中,銳龍有1-2個CCD,核心數6-16個;霄龍有2-12個CCD,核心數16-96個。IOD都是臺積電6nm工藝,但銳龍、霄龍搭檔的截然不同。銳龍這裡的尺寸隻有12.4x9

2022-09-21

使用的服務器節點減少5倍。NVIDIA預計H100芯片將被用於各種工業、醫療保健、超級計算機和雲計算應用,包括大型語言模型、藥物發現、推薦系統、對話式人工智能等。根據早期A100"安培"架構GPU的記錄,分析師認為H100芯

2023-06-19

,旁邊還擺上一顆Intel Sapphire Rapids旗艦級至強W9-3495XIntel 7工藝,56核心,封裝面積接近4400平方毫米(77.5 x 56.5毫米),它在M2 Ultra面前都顯得矮三分。對比來看,M2 Ultra相比上代M1 Ultra也大不少,當然內部結構都是相同的。