芯片功率奔向1000瓦,冷卻成為頭號問題


據anandtech報道,高性能計算(HPC)領域越來越明顯的一個趨勢是,每個芯片和每個機架單元的功耗不會因空氣冷卻的限制而停止。由於超級計算機和其他高性能系統已經達到——並且在某些情況下超過瞭這些限制——功率要求和功率密度不斷擴大。根據臺積電最近一年一度的技術研討會的消息,隨著臺積電為更密集的芯片配置奠定基礎,我們應該期待看到這種趨勢繼續下去。

手頭的問題並不是一個新問題:晶體管功耗的縮小速度幾乎沒有晶體管尺寸那麼快。由於芯片制造商不會放棄性能(並且無法為客戶提供半年增長),因此在 HPC 空間中,每個晶體管的功率正在迅速增長。另一個問題是,chiplet正在為構建具有比傳統標線限制更多矽的芯片鋪平道路,這對性能和延遲有好處,但在冷卻方面更成問題。

支持這種矽和功率增長的是 臺積電 CoWoS 和 InFO等現代技術,它們允許芯片制造商構建集成的多芯片系統級封裝 (SiP),其矽量是臺積電的兩倍。受到標線(reticle )限制。到 2024 年,臺積電 CoWoS 封裝技術的進步將使構建更大的多芯片 SiP 成為可能,臺積電預計將超過四個標線大小的芯片縫合在一起,這將實現巨大的復雜性(每個 SiP 有可能超過 3000 億個晶體管)臺積電及其合作夥伴正在關註)和性能,但自然是以巨大的功耗和發熱為代價的。


NVIDIA 的 H100 加速器模塊等旗艦產品已經需要超過 700W 的功率才能實現峰值性能。因此,在單個產品上使用多個 GH100 大小的chiplet的前景令人大跌眼鏡 - 以及功率預算。臺積電預計,幾年後將出現功耗約為 1000W 甚至更高的多芯片 SiP,從而帶來冷卻挑戰。

在 700W 時,H100 已經需要液冷;英特爾的基於chiplet的 Ponte Vecchio 和 AMD 的 Instinct MI250X 的故事大致相同。但即使是傳統的液體冷卻也有其局限性。當芯片累計達到 1 kW 時,臺積電設想數據中心將需要為這種極端的 AI 和 HPC 處理器使用浸入式液體冷卻系統。反過來,浸入式液體冷卻將需要重新構建數據中心本身,這將是設計上的重大變化,也是連續性方面的重大挑戰。

撇開短期挑戰不談,一旦數據中心設置為浸入式液體冷卻,它們將為更熱的芯片做好準備。液浸式冷卻在處理大型冷卻負載方面具有很大潛力,這也是英特爾大力投資這項技術以使其更加主流化的原因之一。


除瞭浸沒式液體冷卻,還有另一種技術可以用來冷卻超熱芯片——片上水冷。去年,臺積電透露它已經嘗試過片上水冷,並表示甚至可以使用這種技術冷卻 2.6 kW 的 SiP。但當然,片上水冷本身就是一項極其昂貴的技術,它將把那些極端的 AI 和 HPC 解決方案的成本推到前所未有的水平。

盡管如此,雖然未來不是一成不變的,但似乎它已經用矽鑄造瞭。臺積電的芯片制造客戶有客戶願意為這些超高性能解決方案(想想超大規模雲數據中心的運營商)支付高昂的費用,即使這需要高成本和技術復雜性。讓事情回到我們開始的地方,這就是臺積電首先開發 CoWoS 和 InFO 封裝工藝的原因——因為有客戶準備好並渴望通過chiplet技術打破標線限制。今天,我們已經在 Cerebras 的大型晶圓級引擎處理器等產品中看到瞭其中的一些,並且通過大型小芯片,臺積電正準備讓更廣泛的客戶群更容易獲得更小的(但仍然是標線斷裂)設計。

對性能、封裝和冷卻的這種極端要求不僅將半導體、服務器和冷卻系統的生產商推向瞭極限,而且還需要對雲數據中心進行修改。如果用於 AI 和 HPC 工作負載的大規模 SiP 確實變得普遍,那麼未來幾年雲數據中心將完全不同。


相關推薦

2022-09-25

們的主張是,ATX3.0電源帶有原生12VHPWR連接器,支持600瓦功率輸送,不僅能滿足額定450瓦的4090,還能戰未來(比如4090Ti)。原生12VHPWR當然好,根據Intel的ATX 3.0規范可知,除12個電源觸點外,還額外設計4個信號觸點供顯卡與電源通

2023-11-28

kAir沒有風扇,而是使用被動散熱器將熱量從蘋果的節能M2芯片中導出。FroreSystems好奇地想知道主動冷卻解決方案是否能進一步提高性能,於是在筆記本電腦上安裝自己新穎的固態主動冷卻系統,並對其進行多項基準測試,結果令

2023-09-20

中國首發高通驍龍8295智艙芯版首個量產5nm制程的車規級芯片。值得一提的是,它首次完全啟用雙NPU,60TOPS算力相當於上代產品接近8倍性能提升。動力方面,新車將會提供單電機以及雙電機版本,單電機最大功率為200kW,雙電機

2024-03-05

激動。不過,並不清楚克拉克所指的 “B200” 到底是哪款芯片,因為 Nvidia 去年與投資者分享的路線圖中並沒有這個名字。然而,我們猜測克拉克實際上是指的 GB200Superchip,這款芯片預計將結合 Nvidia 的 Grace CPU 和 B100GPU。根據本

2023-11-28

前業內先進的電池快充方案,主要采用電荷泵原理的充電芯片。比如說這次測試的 GT5 、紅米之前的 Note12 210W ,甚至 2019 年的小米 9 ,都是這條路線的快充手機。小米 9 主板:相比傳統的直流降壓充電,電荷泵在手機這

2023-09-15

C報道,高通將為蘋果提供智能手機的5G調制解調器(基帶芯片)直到2026年,即合同延長三年。 雖然高通一直為蘋果iPhone產品提供5G調制解調器,但近年來蘋果一直在努力構建自己的芯片技術來擺脫對第三方企業的依賴。在英特

2022-09-09

當地時間周五上午,芬蘭一座最新核反應的堆輸出功率超過具有裡程碑意義的1000兆瓦,而此時歐洲電力供應市場正需要它能夠得到的所有“兆瓦級”電力供應量,以緩解歐洲愈演愈烈的能源危機。據媒體報道,在今年秋季晚些

2023-01-16

工藝迭代帶來的常規演變,以英特爾、英偉達和AMD為首的芯片巨頭之間的競爭變得異常激烈。從英特爾、英偉達、AMD三傢的產品佈局來看,三傢幾乎都集齊CPU、GPU甚至是DPU產品線。如今,他們正在醞釀更大的規劃!隨著近日AMD推

2023-10-21

8處理器、超長續航組合、最強折疊影像、國密認證安全芯片等重磅硬件和技術,在市場上具有較高的競爭力。

2022-09-01

年,臺積電宣佈斥資120億美元在美國亞利桑那州建一座5nm芯片廠(Fab21)。今年7月,臺積電美國亞利桑那州Fab21工廠舉行上梁典禮。據媒體報道,美國當地州府官員透露,該工廠的主要建設工作已經完成。實際上,早先上梁典禮

2022-10-04

15000W的級別,即便是300-400W級別的CPU/GPU,估計一套塞入30+芯片沒什麼問題。這套散熱系統還在開發優化中,已經有多傢廠商采用,國內的服務器廠商浪潮就展示這樣的服務器,未來Sapphire Rapids處理器全面上市的時候,估計會有更

2023-02-12

據videoCards報道,ComputerBase測試NVIDIA最新移動顯卡的功率解析度。人們已經知道低端SKU因為有更多的功率餘地而壓垮旗艦SKU是一個眾所周知且有證據的問題。這在兩代GeForce之前就已經成為一個問題,這迫使英偉達和筆記本電腦制

2023-06-25

明年下半年的旗艦規劃更高充電功率,其配備的無線充電芯片在硬件上支持到100W,日常使用將控制在80W以內,標稱為80W無線充電。

2022-09-07

來一些現實的好處。這種新的PS5型號在遊戲過程中消耗的功率大約減少20-30瓦,同時仍然提供大約相同級別的噪音和熱量。Evans在Twitter上說:"索尼縮小幾乎所有的部件,包括主板和內部包裝,以使其更輕,而且造假幾乎可以