富士通是一傢日本跨國企業集團,主要銷售個人和企業計算產品以及x86和大型服務器。該公司在高性能計算(HPC)領域也很活躍,當然也像地球上其他科技公司一樣,對利用最新的人工智能熱潮很感興趣。
富士通開發兩項新技術,旨在優化強大的高性能計算系統上的 CPU 和 GPU 工作負載。該公司正致力於實時分配資源,以更好地管理具有高執行效率的進程,同時優化多個程序的並行處理。富士通表示,新解決方案旨在解決生成學習和其他人工智能相關技術的爆炸性需求所導致的全球GPU短缺問題。
這些優化技術包括一個"自適應GPU分配器"(Adaptive GPU Allocator),它似乎可以檢測出程序是需要在GPU加速器上執行還是在CPU上執行。分配器是作為一個獨立的服務器實現的,旨在測量代碼執行性能。
如果程序希望在 HPC 系統中使用 GPU,分配器服務器就會批準訪問,同時檢查 GPU 和 CPU 上迷你批處理作業的處理時間。如果 GPU 批次測試不能充分縮短處理時間,分配器就會繼續在 CPU 上重新分配作業。不幸的是,程序需要專門編寫,以便通過專用框架使用新的分配器服務器,富士通公司證實這一點。
另一種優化高性能計算工作負載的解決方案是交互式高性能計算(Interactive HPC),富士通將其描述為世界上第一種"在高性能計算系統上實時切換多個程序執行"的技術。富士通解釋說,傳統的控制方法采用單播通信,將程序執行"逐個"切換到每臺服務器上。
交互式 HPC 采用廣播通信方法,向 HPC 系統中的每個計算節點發送切換指令。富士通表示,在256節點的高性能計算環境中工作時,新方法似乎足以將進程切換時間從幾秒縮短到100毫秒。
富士通對新GPU分配技術的計劃主要集中在AI平臺"Kozuchi"上,該公司的人工智能平臺旨在為客戶提供測試"先進人工智能技術"的快速方法。這項 HPC 優化技術還將應用於富士通的 40 量子位量子計算機模擬器。在計算即服務的高性能計算環境中的進一步應用似乎也在考慮之中。