亞馬遜發力捍衛在雲計算領域的領先地位,一邊升級自研的雲芯片、推出亞馬遜版的GPT——人工智能(AI)聊天機器人,一邊深化同英偉達的合作,推出基於英偉達芯片的新服務、和英偉達共同研發超級計算機。
AWS的副總裁Dave Brown表示,通過將自研芯片的設計重點放在對客戶重要的實際工作負載上,AWS能為他們提供最先進的雲基礎設施。此次推出的Graviton4是五年內的第四代芯片產品,隨著人們對生成式 AI 興趣的高漲,第二代AI芯片Trainium2 將幫助客戶以更低的成本和更高的能效更快地訓練自己的機器學習模型。
Graviton4計算性能較前代提高多達30%
美東時間11月28日周二,亞馬遜旗下雲計算業務AWS宣佈,推出新一代的AWS自研芯片。其中,通用芯片Graviton4的計算性能較前代Graviton3提高多達30%,內核增加50%,內存帶寬提升75%,從而在亞馬遜雲服務器托管服務Amazon Elastic Compute Cloud(EC2)上提供最高性價比和能源利用效果。
Graviton4還通過對所有高速物理硬件接口進行完全加密提高安全性。AWS稱,Graviton4 將應用於內存優化的Amazon EC2 R8g 實例,讓客戶能改進高性能數據庫、內存緩存和大數據分析工作負載的執行。R8g 實例提供更大的實例大小,比前代 R7g實例的 vCPU 高最多三倍的,內存高三倍。
應用Graitons4的電腦將在未來數月內上市。AWS稱,啟動Garviton項目約五年來,已生產超過200萬個Garviton處理器,AWS EC2的前100位用戶都選擇使用Graviton。
Trainium2速度提高四倍 訓練萬億參數級模型
AWS的另一款新品——新一代AI芯片Trainium2速度比前代Trainium1快四倍,將能在EC2 UltraCluster中部署多達10萬個芯片,讓用戶能在很短的時間內訓練數以萬億參數的基礎模型(PM)和大語言模型 (LLM),同時能源利用率較前代提高多達兩倍。
Trainium2 將用於Amazon EC2 Trn2 實例,單個實例中包含16 個Trainium 芯片。Trn2 實例旨在幫助客戶在下一代 EC2 UltraCluster中擴展芯片應用數量至多達10萬個Trainium2 芯片,聯通AWS Elastic Fabric Adapter (EFA) petabit級網絡,提供高達 65 exaflops 的算力。
AWS稱,Trainium2將從明年開始用於支持新的服務。
升級版Grace Hopper的首傢大客戶 DGX雲采用GH200 NVL32 速度最快GPU驅動AI超算
除自研芯片,AWS周二還在年度大會re:Invent期間同英偉達共同宣佈,擴大戰略合作,提供最先進的基礎設施、軟件和服務,助力客戶的生成式AI創新。
AWS 將成為第一傢在雲上采用全新多節點NVLink技術英偉達H200 Grace Hopper超級芯片的雲服務商,也就是說,AWS將是升級版Grace Hopper的第一個大客戶。
英偉達的H200 NVL32 多節點平臺將 32 個 Grace Hopper芯片與 NVLink 和 NVSwitch 技術共同用於一個實例。該平臺將用於與亞馬遜網絡EFA連接的Amazon EC2實例,並由高級虛擬化 (AWS Nitro System) 和超大規模集群 (Amazon EC2 UltraClusters) 提供支持,使亞馬遜和英偉達共同的客戶能夠擴展部署數以千計的H200芯片。
英偉達和AWS將共同在AWS上托管英偉達的AI 訓練即服務DGX Cloud,它將是第一個采用GH200 NVL32 的 DGX 雲,能為開發人員提供單個實例中最大的共享內存。AWS 的DGX雲將提高尖端生成式AI 和超過1萬億參數的大語言模型的訓練。
英偉達和AWS 正在共同研發名為Ceiba 的項目,設計世界上速度最快的GPU驅動AI 超級計算機,這是一個采用 GH200 NVL32 和 Amazon EFA 互連的大規模系統。它是搭載1.6384萬塊GH200超級芯片的超級計算機 ,AI處理能力達65 exaflops。英偉達將用它推動下一波生成式AI 創新。
企業客戶機器人亞馬遜Q預覽版上線 幫助在AWS上開發App
除芯片和雲服務,AWS還推出自己的AI聊天機器人預覽版,名為亞馬遜Q。它是生成式AI技術支持的新型數字助手,可根據企業客戶的業務進行工作,幫助企業客戶搜索信息、編寫代碼和審查業務指標。
Q接受AWS內部有關代碼和文檔的部分培訓,可供AWS雲的開發者使用。
開發者可以用Q在AWS上創建App、研究最佳實踐、改正錯誤、獲得為App編寫新功能的幫助。用戶可以通過對話式的問答功能與Q進行交互,學習新知識、研究最佳實踐以及解如何在AWS上構建App,無需將註意力從 AWS 控制臺上移開。
Q還將被添加到亞馬遜的企業智能軟件、呼叫中心工作人員和物流管理的程序。 AWS表示,客戶可以根據公司的數據或個人資料,對Q進行定制。
Q 對話式問答功能目前在所有提供企業AWS的地區提供預覽版。