NVIDIA發佈一段視頻,首次向公眾展示其最新的數據中心級超級計算機Eos,讓人們一窺為先進的AI設備供應商提供動力的架構。作為一臺超大規模的英偉達DGX超級計算機,Eos是NVIDIA開發人員利用加速計算基礎設施和全面優化的軟件創造人工智能突破的產物。
Eos由576套英偉達DGX H100系統、NVIDIA Quantum-2 InfiniBand網絡和軟件組成,可提供總計18.4 exaflops的FP8人工智能性能。Eos超級計算機於11月在2023年超級計算貿易展上亮相,Eos以希臘神話中每天打開黎明之門的女神命名,體現英偉達致力於推動人工智能技術發展的承諾。
每臺DGX H100系統都配備8顆英偉達H100 Tensor Core GPU。Eos總共配備4,608個H100 GPU。因此,Eos 可以處理最大的人工智能工作負載,以訓練大型語言模型、推薦系統、量子模擬等。它展示NVIDIA技術在大規模工作時的能力。
Eos的誕生恰逢人們正在利用生成式人工智能改變世界,從藥物發現到聊天機器人再到自主機器等等。為實現這些突破,他們需要的不僅僅是人工智能專業知識和開發技能。他們需要一個人工智能工廠--一個隨時可用的專用人工智能引擎,它可以幫助提高他們大規模構建人工智能模型的能力。
Eos在全球最快超級計算機TOP 500 榜單中名列第 9 位,推動人工智能技術和基礎設施的發展。它包括NVIDIA先進的加速計算和網絡,以及先進的軟件產品,如NVIDIA Base Command和NVIDIA AI Enterprise。
Eos的架構針對需要在大型加速計算節點集群中實現超低延遲和高吞吐量互聯的人工智能工作負載進行優化,使其成為希望擴展人工智能能力的企業的理想解決方案。基於英偉達Quantum-2 InfiniBand與網內計算技術,其網絡架構支持400 Gb/s的數據傳輸速度,促進訓練復雜人工智能模型所必需的大型數據集的快速移動。
Eos的核心是由英偉達DGX H100系統支持的開創性DGX SuperPOD架構。該架構旨在為人工智能和計算領域提供能夠進行大規模計算的緊密集成的全棧系統。隨著全球企業和開發人員都在尋求利用人工智能的力量,Eos作為一種關鍵資源,有望加速人工智能應用的發展。