亞馬遜發力捍衛雲地位:升級自研AI芯片 發佈聊天機器人Q 搶先用Grace Hopper


亞馬遜發力捍衛在雲計算領域的領先地位,一邊升級自研的雲芯片、推出亞馬遜版的GPT——人工智能(AI)聊天機器人,一邊深化同英偉達的合作,推出基於英偉達芯片的新服務、和英偉達共同研發超級計算機。

AWS的副總裁Dave Brown表示,通過將自研芯片的設計重點放在對客戶重要的實際工作負載上,AWS能為他們提供最先進的雲基礎設施。此次推出的Graviton4是五年內的第四代芯片產品,隨著人們對生成式 AI 興趣的高漲,第二代AI芯片Trainium2 將幫助客戶以更低的成本和更高的能效更快地訓練自己的機器學習模型。

Graviton4計算性能較前代提高多達30%

美東時間11月28日周二,亞馬遜旗下雲計算業務AWS宣佈,推出新一代的AWS自研芯片。其中,通用芯片Graviton4的計算性能較前代Graviton3提高多達30%,內核增加50%,內存帶寬提升75%,從而在亞馬遜雲服務器托管服務Amazon Elastic Compute Cloud(EC2)上提供最高性價比和能源利用效果。

Graviton4還通過對所有高速物理硬件接口進行完全加密提高安全性。AWS稱,Graviton4 將應用於內存優化的Amazon EC2 R8g 實例,讓客戶能改進高性能數據庫、內存緩存和大數據分析工作負載的執行。R8g 實例提供更大的實例大小,比前代 R7g實例的 vCPU 高最多三倍的,內存高三倍。

應用Graitons4的電腦將在未來數月內上市。AWS稱,啟動Garviton項目約五年來,已生產超過200萬個Garviton處理器,AWS EC2的前100位用戶都選擇使用Graviton。


Trainium2速度提高四倍 訓練萬億參數級模型

AWS的另一款新品——新一代AI芯片Trainium2速度比前代Trainium1快四倍,將能在EC2 UltraCluster中部署多達10萬個芯片,讓用戶能在很短的時間內訓練數以萬億參數的基礎模型(PM)和大語言模型 (LLM),同時能源利用率較前代提高多達兩倍。

Trainium2 將用於Amazon EC2 Trn2 實例,單個實例中包含16 個Trainium 芯片。Trn2 實例旨在幫助客戶在下一代 EC2 UltraCluster中擴展芯片應用數量至多達10萬個Trainium2 芯片,聯通AWS Elastic Fabric Adapter (EFA) petabit級網絡,提供高達 65 exaflops 的算力。

AWS稱,Trainium2將從明年開始用於支持新的服務。


升級版Grace Hopper的首傢大客戶 DGX雲采用GH200 NVL32  速度最快GPU驅動AI超算

除自研芯片,AWS周二還在年度大會re:Invent期間同英偉達共同宣佈,擴大戰略合作,提供最先進的基礎設施、軟件和服務,助力客戶的生成式AI創新。

AWS 將成為第一傢在雲上采用全新多節點NVLink技術英偉達H200 Grace Hopper超級芯片的雲服務商,也就是說,AWS將是升級版Grace Hopper的第一個大客戶。

英偉達的H200 NVL32 多節點平臺將 32 個 Grace Hopper芯片與 NVLink 和 NVSwitch 技術共同用於一個實例。該平臺將用於與亞馬遜網絡EFA連接的Amazon EC2實例,並由高級虛擬化 (AWS Nitro System) 和超大規模集群 (Amazon EC2 UltraClusters) 提供支持,使亞馬遜和英偉達共同的客戶能夠擴展部署數以千計的H200芯片。

英偉達和AWS將共同在AWS上托管英偉達的AI 訓練即服務DGX Cloud,它將是第一個采用GH200 NVL32 的 DGX 雲,能為開發人員提供單個實例中最大的共享內存。AWS 的DGX雲將提高尖端生成式AI 和超過1萬億參數的大語言模型的訓練。

英偉達和AWS 正在共同研發名為Ceiba 的項目,設計世界上速度最快的GPU驅動AI 超級計算機,這是一個采用 GH200 NVL32 和 Amazon EFA 互連的大規模系統。它是搭載1.6384萬塊GH200超級芯片的超級計算機 ,AI處理能力達65 exaflops。英偉達將用它推動下一波生成式AI 創新。


企業客戶機器人亞馬遜Q預覽版上線 幫助在AWS上開發App

除芯片和雲服務,AWS還推出自己的AI聊天機器人預覽版,名為亞馬遜Q。它是生成式AI技術支持的新型數字助手,可根據企業客戶的業務進行工作,幫助企業客戶搜索信息、編寫代碼和審查業務指標。

Q接受AWS內部有關代碼和文檔的部分培訓,可供AWS雲的開發者使用。

開發者可以用Q在AWS上創建App、研究最佳實踐、改正錯誤、獲得為App編寫新功能的幫助。用戶可以通過對話式的問答功能與Q進行交互,學習新知識、研究最佳實踐以及解如何在AWS上構建App,無需將註意力從 AWS 控制臺上移開。

Q還將被添加到亞馬遜的企業智能軟件、呼叫中心工作人員和物流管理的程序。 AWS表示,客戶可以根據公司的數據或個人資料,對Q進行定制。

Q 對話式問答功能目前在所有提供企業AWS的地區提供預覽版。



相關推薦

2023-04-14

據報道,亞馬遜今日推出一項名為“Bedrock”的雲服務,允許開發者使用類似於ChatGPT聊天機器人的人工智能系統,來進一步強化他們的軟件。此舉表明,作為最大的雲計算服務提供商,亞馬遜不會將生成式人工智能領域的巨大商

2023-05-16

聊天機器人,感受到危機臨近的不隻是谷歌,連電商巨頭亞馬遜也加入焦慮的行列。最新報道顯示,亞馬遜正在考慮給網上商店的搜索欄搞一點AI升級。據當地媒體周一報道,亞馬遜在一份招聘高級軟件開發工程師(機器學習方

2024-03-25

#160;protected]業界預計,將采用Blackwell系列芯片的公司包括亞馬遜、Google、Meta、微軟、OpenAI、特斯拉和xAI。黃仁勛透露,新GPU的價格為3萬到4萬美元,這無疑將進一步推動英偉達的營收。英偉達還推出NIM(英偉達推理微服務),提

2023-12-05

右的補貼用於芯片領域,來加強日本在全球半導體領域的地位,其中部分資金將用於支持臺積電和日本高端芯片公司Rapidus。今年5月28日,英偉達和軟銀公司曾宣佈,雙方正在合作打造一個基於英偉達GH200 Grace Hopper超級芯片、面

2024-02-02

亞馬遜發佈一款人工智能購物助手,名叫"魯弗斯"(Rufus),與公司的吉祥物柯基犬同名。新的聊天機器人是根據亞馬遜的產品庫和客戶評論以及網絡信息訓練出來的,可以回答有關產品的問題、進行比較、提

2024-03-19

門事件。在這場兩個小時的演講中,黃仁勛公佈搭載B200芯片的GB200 Grace Blackwell超級芯片系統,以及英偉達在AI軟件(NIM微服務)、Omiverse雲、具身智能方面的最新進展。以下為演講內容回顧:黃仁勛登臺,對觀眾們強調:我希望

2024-03-21

,而且解決以往的並不算優秀的能效和成本問題。2.著重發力具身智能英偉達在GTC大會上公佈一系列應用方面的新成果,例如生物醫療、工業元宇宙、機器人、汽車等領域。其中機器人(具身智能)是它著重發力的方向。它推出

2024-03-20

的生成式AI應用而打造的車載計算平臺,是上代DRIVEOrin的升級版,將所有功能整合在同一個集中式平臺上。它可提供豐富的座艙功能、安全可靠的高度自動化駕駛和無人駕駛功能,廣泛適用於新能源汽車、卡車、自動駕駛出租車

2023-03-22

擬來測試車輛性能。老黃在演講期間分享一個視頻,展示亞馬遜如何用英偉達Omniverse平臺構建完全逼真的數字孿生機器人倉庫,以節省時間和金錢。英偉達與寶馬集團宣佈擴大合作,為汽車制造商開設第一個完全虛擬工廠。寶馬

2023-08-10

還有數以萬計的相關依賴,而且安全可靠。Google、微軟、亞馬遜、甲骨文等英偉達合作方都會在自己的雲平臺中集成這項服務。“人類將成為一門新的編程語言”除此之外,英偉達的計算機圖形與仿真模擬平臺Omniverse,也宣佈一

2024-03-14

亞馬遜上的賣傢很快就能通過復制粘貼鏈接來制作產品頁面。亞馬遜發佈一項新的人工智能生成功能,該功能可以從賣傢的外部網站獲取信息,然後為該商品生成一個亞馬遜產品頁面,並附上文字說明和圖片。亞馬遜全球銷售合

2022-08-15

17億美元,亞馬遜再次出手,將美國掃地機器人龍頭iRobot收入囊中。相比於此前85億美元收購米高梅、39億美元收購OneMedical,此次對於iRobot的收購,從金額上來看可能並不突出,但是它對亞馬遜的未來戰略來說,卻相當重要。為

2024-03-19

核心基礎——英偉達表示,目前的核心大數據運營商包括亞馬遜公司、微軟,以及谷歌母公司Alphabet公司。英偉達還透露,谷歌和甲骨文公司基於Blackwell的新型硬件產品將於今年晚些時候上市。黃仁勛在演講中表示,人工智能是

2023-11-14

務方面,除英偉達自己投資的CoreWeave、Lambda和Vultr之外,亞馬遜雲科技、Google雲、微軟Azure和甲骨文雲基礎設施,都將成為首批部署基於H200實例的供應商。此外,在新的H200加持之下,GH200超級芯片也將為全球各地的超級計算中心