富士通新技術可優化人工智能和高性能計算工作負載的CPU和GPU分配


富士通是一傢日本跨國企業集團,主要銷售個人和企業計算產品以及x86和大型服務器。該公司在高性能計算(HPC)領域也很活躍,當然也像地球上其他科技公司一樣,對利用最新的人工智能熱潮很感興趣。

2023-11-15-image-6-j_1100.webp

富士通開發兩項新技術,旨在優化強大的高性能計算系統上的 CPU 和 GPU 工作負載。該公司正致力於實時分配資源,以更好地管理具有高執行效率的進程,同時優化多個程序的並行處理。富士通表示,新解決方案旨在解決生成學習和其他人工智能相關技術的爆炸性需求所導致的全球GPU短缺問題。

這些優化技術包括一個"自適應GPU分配器"(Adaptive GPU Allocator),它似乎可以檢測出程序是需要在GPU加速器上執行還是在CPU上執行。分配器是作為一個獨立的服務器實現的,旨在測量代碼執行性能。

如果程序希望在 HPC 系統中使用 GPU,分配器服務器就會批準訪問,同時檢查 GPU 和 CPU 上迷你批處理作業的處理時間。如果 GPU 批次測試不能充分縮短處理時間,分配器就會繼續在 CPU 上重新分配作業。不幸的是,程序需要專門編寫,以便通過專用框架使用新的分配器服務器,富士通公司證實這一點。

另一種優化高性能計算工作負載的解決方案是交互式高性能計算(Interactive HPC),富士通將其描述為世界上第一種"在高性能計算系統上實時切換多個程序執行"的技術。富士通解釋說,傳統的控制方法采用單播通信,將程序執行"逐個"切換到每臺服務器上。

交互式 HPC 采用廣播通信方法,向 HPC 系統中的每個計算節點發送切換指令。富士通表示,在256節點的高性能計算環境中工作時,新方法似乎足以將進程切換時間從幾秒縮短到100毫秒。

富士通對新GPU分配技術的計劃主要集中在AI平臺"Kozuchi"上,該公司的人工智能平臺旨在為客戶提供測試"先進人工智能技術"的快速方法。這項 HPC 優化技術還將應用於富士通的 40 量子位量子計算機模擬器。在計算即服務的高性能計算環境中的進一步應用似乎也在考慮之中。


相關推薦

2023-11-11

資源的合理利用。富士通希望能夠提高計算效率,以滿足人工智能(AI)和深度學習領域對GPU的持續需求,更高效地利用超算系統中寶貴的GPU算力,將一些非必要的工作留給CPU處理。富士通還結合新開發的交互式高性能計算技術

2023-05-11

的 Google I/O 大會上宣佈的。開發者大會已經成為Google許多人工智能軟件和硬件能力的展示。在微軟將 OpenAI 的技術應用於 Bing 搜索和辦公生產力應用程序之後,Google加速其 AI 開發。該超級計算機面向希望訓練大型語言模型的客戶

2024-03-04

當今的人工智能基礎設施主要依靠GPU加速服務器的擴展來推動,其中的主要玩傢Google指出,根據其GoogleCloudServices雲計算體系內部分析的記錄,CPU仍然是人工智能/ML工作負載的主要計算設備。在TechFieldDay活動期間,Google雲產品經

2022-09-02

其需要提升本地信息處理和 AI 推理性能,以應對未來的人工智能工作負載的需求。而面向 IoT Edge 的英特爾 12 代酷睿 SoC 處理器,正好能夠在滿足這方面的性能需求的同時,擴展相關項目實施的可配置性、以及整體解決方案的靈

2022-08-31

達宣佈與戴爾達成的一項新合作,致力於為零信任安全和人工智能時代打造全新的數據中心解決方案。通過結合戴爾的PowerEdge服務器、英偉達的BlueFieldDPU/GPU/AIEnterprise軟件、以及針對VMwarevSphere8虛擬化平臺的負載優化,其希望為

2023-10-16

型的訓練與負載:算力與成本之間需要尋找一個平衡隨著人工智能和深度學習的發展,模型訓練所需的數據量和處理能力在不斷增加。多傢研究報告顯示,當前大型模型的訓練數據量通常都達到數百萬甚至數千萬級別。這些大型

2022-07-09

一個遊戲場景將被劃分為單獨的塊,並分配給小芯片,以優化遊戲中著色器的利用率。AMD公司公佈的新專利為該公司計劃在未來幾年內利用下一代GPU和CPU技術做什麼打開更多的視角。在六月底,AMD有五十四項專利申請被披露。目

2023-03-30

一個於麥克斯韋方程組的數學工具,但英偉達表示,基於人工智能的計算光刻技術“正在開發中”。想象一些如果AI技術引入計算光刻又將如何?寫在最後沒有計算光刻技術的支撐,芯片制造商就不可能制造出最新的技術節點。c

2022-09-13

igy 仍然擁有比 AMD 的Milan 或者 Genoa更強大的 DRAM 子系統。富士通的 A64FX 確實具有相當的 DRAM 帶寬,但它使用 HBM,這極大地限制它的內存容量。服務器市場是一個更難的問題。Prodigy 擁有不錯的大型 L1 緩存、不錯的重新排序能力

2022-06-22

代高帶寬內存以實現最佳的深度學習性能。這種設計將在人工智能和機器學習數據分析方面表現出色,以創建更快更準確的模型,並能夠量化其預測的不確定性。AMD將為其Instinct MI300'CDNA 3'GPU利用5納米工藝節點。該芯片將

2023-11-13

支持解鎖以前在筆記本電腦上無法實現的工作流程,例如人工智能開發人員使用具有數十億參數的更大變壓器模型。人工智能和視頻的定制引擎M3、M3 Pro 和 M3 Max 還具有增強的神經引擎,可加速強大的機器學習 (ML) 模型。神經引

2022-08-17

。高性能計算(HPC)原始性能是英偉達 H100 平臺的 3 倍。人工智能(AI)訓練和推理工作負載性能是 6 倍、同功率下更是高達 10 倍。公司首席執行官兼創始人 Radoslav Danilak 博士表示:Tachyum 的革命性設計,可為美國能源部的 NNSA

2022-09-09

進一步擴大。阿裡巴巴、華碩、Azure、壁仞科技、戴爾、富士通、技嘉、H3C、HPE、浪潮、Intel、Krai、聯想、Moffett、Nettrix、NeuralMagic、NVIDIA其中,NVIDIA表現依然亮眼,首次攜H100參加MLPerf測試,並在所有工作負載中刷新世界紀錄。H1

2023-11-02

一階段超級計算機。領先的技術團隊建造英國速度最快的人工智能超級計算機,利用人工智能(AI)和高性能計算(HPC)的力量解決一些世界上最緊迫的挑戰。這為英國未來的技術領先地位和英國技術行業的外來投資指明方向。D