富士通新技術可優化人工智能和高性能計算工作負載的CPU和GPU分配

2023-11-16 發表於業界精選

富士通是一傢日本跨國企業集團，主要銷售個人和企業計算產品以及x86和大型服務器。該公司在高性能計算（HPC）領域也很活躍，當然也像地球上其他科技公司一樣，對利用最新的人工智能熱潮很感興趣。

富士通開發兩項新技術，旨在優化強大的高性能計算系統上的 CPU 和 GPU 工作負載。該公司正致力於實時分配資源，以更好地管理具有高執行效率的進程，同時優化多個程序的並行處理。富士通表示，新解決方案旨在解決生成學習和其他人工智能相關技術的爆炸性需求所導致的全球GPU短缺問題。

這些優化技術包括一個"自適應GPU分配器"（Adaptive GPU Allocator），它似乎可以檢測出程序是需要在GPU加速器上執行還是在CPU上執行。分配器是作為一個獨立的服務器實現的，旨在測量代碼執行性能。

如果程序希望在 HPC 系統中使用 GPU，分配器服務器就會批準訪問，同時檢查 GPU 和 CPU 上迷你批處理作業的處理時間。如果 GPU 批次測試不能充分縮短處理時間，分配器就會繼續在 CPU 上重新分配作業。不幸的是，程序需要專門編寫，以便通過專用框架使用新的分配器服務器，富士通公司證實這一點。

另一種優化高性能計算工作負載的解決方案是交互式高性能計算（Interactive HPC），富士通將其描述為世界上第一種"在高性能計算系統上實時切換多個程序執行"的技術。富士通解釋說，傳統的控制方法采用單播通信，將程序執行"逐個"切換到每臺服務器上。

交互式 HPC 采用廣播通信方法，向 HPC 系統中的每個計算節點發送切換指令。富士通表示，在256節點的高性能計算環境中工作時，新方法似乎足以將進程切換時間從幾秒縮短到100毫秒。

富士通對新GPU分配技術的計劃主要集中在AI平臺"Kozuchi"上，該公司的人工智能平臺旨在為客戶提供測試"先進人工智能技術"的快速方法。這項 HPC 優化技術還將應用於富士通的 40 量子位量子計算機模擬器。在計算即服務的高性能計算環境中的進一步應用似乎也在考慮之中。

富士通新技術可優化人工智能和高性能計算工作負載的CPU和GPU分配

相關推薦

富士通推出GPU自適應分配技術更合理地分配CPU和GPU資源

谷歌推擁有26000個H100的超算加速AI軍備競賽

Google：引領AI推理工作量的是CPU而非GPU

英特爾為物聯網邊緣計算市場推出插槽式12代酷睿SoC解決方案

戴爾與英偉達達成合作為零信任安全和AI提供數據中心解決方案

大模型時代下的技術變革：訓練、負載、部署、效率、安全……都遇到新挑戰？

AMD公佈GPU芯片新專利推動優化遊戲中的著色器

什麼是計算光刻？NVIDIA改變遊戲規則光掩模產量可增加3-5倍

一個號稱“萬能”的CPU架構

AMD Instinct MI300 APU將為El Capitan超算提供2 Exaflops雙精度算力

蘋果M3在CPU測試中暴露出的一個問題

Tachyum宣佈參與美國能源部20-ExaFlop超算項目競標

NVIDIA 4nm GPU性能首秀：最大4.5倍提升

英特爾、戴爾和劍橋大學宣佈部署“黎明”超級計算機第一期