老黃發佈最強AIGC芯片“生成式AI的iPhone時刻已來”


他來他來,老黃帶著“最強生成式AI處理器”和一系列重磅更新來!在計算機圖形學頂會SIGGRAPH上,老黃宣佈英偉達最新的超級芯片NVIDIADGXGH200GraceHopper。這塊芯片搭載全球最快的內存,不僅帶寬每秒5TB,內存容量更是暴增接近50%來到141GB,“任何大語言模型都能運行”。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

同時,英偉達還宣佈和Hugging Face的合作——

以後在Hugging Face平臺上,不需要再下載ML模型自己運行,隻需要幾步簡單操作,就能在筆記本上運行大模型,有Colab內味(就是不知道有沒有免費版)。

至於軟件更新,字裡行間也全是AI。

不僅在Omniverse平臺中集成一系列時下熱門的AI工具,新的軟件有不少也是基於大模型打造,像ChatUSD就能幫開發者們寫代碼。

這也是時隔五年,老黃再次登上SIGGRAPH的舞臺。在會上,他自信滿滿地宣佈:生成式人工智能的“iPhone時刻”,已經來臨。

有網友看完發佈會後感慨:英偉達在AI硬件這方面,已經無人能及。


新芯片組成的“最強超算”來襲

這場發佈會中最先拋出,也是最引人矚目的,非“最強超算”莫屬。

這臺超級計算機由256塊DGX GH200 Grace Hopper(簡稱DGX GH200)連接而成。

用老黃的話,這個“龐然大物”就是為AIGC時代量身打造的。

它的算力和內存容量分別達到1E(10^15)FLOPS和144TB。

下面這張圖展示它的真實大小(中間的黑影是老黃)。


不僅是性能優異,對比發現,性價比簡直完爆CPU。

同樣花1億美元,拿來買CPU和GPU分別能得到什麼?

CPU的話,可以買8800個x86架構的產品。

這近九千塊CPU加起來,隻能帶動一個LLaMA 2、SDXL這樣規模的AI程序。

功率嘛……是5兆瓦,也就是每小時5000度電。


如果換成GPU的話,則是2500塊DGX GH200。

能帶動的近似規模的AI程序一下增加到12個,功率卻降低到3兆瓦。


平均到單個程序上,需要210塊DGX GH200,價格是800萬美元,功率則為0.26兆瓦。


而組成這個“最強超算”的DGX GH200,同樣是王者級別,被稱為“最強生成式AI處理器”。


DGX GH200由Grace CPU和Hopper GPU組成。

其中Grace CPU包含72核心,而後者擁有4P(10^12)FLOPS的算力和500GB的LPDDR5X。

此外,DGX GH200中還加入海力士的“最快內存”HBM3e。

它的容量為141GB,帶寬則高達每秒5TB,分別是H100的1.7倍和1.55倍。

(好傢夥,H100都隻配當baseline)


在DGX GH200中,CPU和GPU之間的連接速度是第五代PCIe的7倍。


而從單塊DGX GH200到整個超級計算機的過程,主打的就是一個“疊”。

這要得益於它的多GPU高速連接能力。

雙聯體的DGX GH200,性能幾乎沒有損失,直接就是單體的兩倍。


將雙聯體的DGX GH200與BlueField-3 DPU和ConnectX-7網卡,就組成一個“計算盒”。


通過NVLink,8個這樣的“計算盒”高速連接,就得到DGX構建塊,總內存達到4.6TB。


這樣的構建塊可以合二為一形成新的計算盒,並最終擴展成256 GPU的工作集群Superpod。

NVLink的高速連接能力,讓這256塊GPU“就像是一塊一樣”工作。


至此,顯卡超算的規模已經達到本節開頭老黃所展示的水平。

但這還沒有結束——Superpod之間還能繼續連接。

在高速低延時的Quantum-2 Infiniband平臺幫助下,超算的規模可以接著擴展……

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

講到這裡,老黃還打趣道:

如果哪天你從(某電商平臺)上買顯卡的時候發現它,千萬不要覺得驚訝!

總之,根據不同需要,利用DGX GH200將能構建出不同規模的、適應AIGC時代的超級計算機。

據預計,DGX GH200將於明(2024)年第二季度投產。

還發3個RTX新專業顯卡

除“最強生成式AI處理器”以外,英偉達這次也推出3款船新的工作站顯卡:

RTX 5000、RTX 4500和RTX 4000。

這幾款顯卡均基於Ada Lovelace架構設計,目前參數已經同步英偉達官網:


當然,專業顯卡售價也更貴。

其中RTX 5000售價達到4000美元(約合人民幣2.87萬元),RTX 4500售價2250美元(約1.6萬元),RTX 4000售價1250美元(約8987元)。

老黃也在發佈RTX顯卡時,再次說出那句經典名言:

買得越多,省得越多(the more you buy, the more you save)。


至於去年9月發佈的RTX 6000 Ada顯卡,在這次大會上也推出一個新的工作站設計:4塊疊起來,搞個頂級“疊疊樂”。

這樣設計的單個RTX工作站,單個可以提供5828 TFLOPS的AI性能,以及192GB的GPU內存。

除此之外,老黃還在這次大會上宣佈一個搭載L40S Ada GPU的新款OVX服務器,數據中心專用。


每臺服務器搭載8塊L40S Ada GPU,每塊L40S包含高達18176個CUDA核心,可以提供提供近5倍於A100的單精度浮點(FP32)性能。

相比A100,L40S微調(fine-tune)大模型的性能提升大約1.7倍。

(沒錯,A100已經被老黃用來給新硬件當對比)

具體來說,在這個OVX服務器上微調一個860M參數的大模型,現在隻需要7小時就可以完成;

400億參數的GPT-3大模型,更是隻需要15個小時就能微調完成。

在渲染上,L40S性能也不錯,配備142個第三代RT核心,可以提供212 teraflops的光線追蹤性能。

預計L40S將於今年秋季上市。

AIGC版Colab來,筆記本跑大模型

不僅是硬件上接連拋出一系列“重磅炸彈”,軟件方面英偉達也發佈多款新產品。

首先是和HuggingFace合作,把NVIDIA DGX Cloud AI整合到其中。

在HF的頁面中,一鍵就能讓模型在雲上調整運行


英偉達科學傢范麟熙(Jim Fan)激動地宣佈這一消息,還透露其中使用的每個節點都是8個H100或A100。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

除與HF合作,英偉達還推出自己的Workbench平臺。

通過連接雲端服務,用筆記本電腦就能跑大模型。

現場還播放通過Workbench跑SDXL的演示視頻。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

在Jupyter中,演示者讓SDXL畫一個“玩具老黃”。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

此時的SDXL還不知道“玩具老黃”是個啥玩意兒。

於是演示者現場用8張圖對模型進行微調。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

微調後重新繪制的作品,是不是有那味?

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

除上述兩款大模型運行工具,英偉達還推出最新版的企業軟件平臺NVIDIA AI enterprise 4.0。

軟件包的數量達到4500個,還有數以萬計的相關依賴,而且安全可靠。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

Google、微軟、亞馬遜、甲骨文等英偉達合作方都會在自己的雲平臺中集成這項服務。

“人類將成為一門新的編程語言”

除此之外,英偉達的計算機圖形與仿真模擬平臺Omniverse,也宣佈一系列新進展。

一方面,更多AI工具可以直接在Omniverse裡面調用。

包括對話式AI角色創建工具Convai、高保真AI動捕工具Move AI、AI低成本制作CG工具CGWonder Dynamics在內,一系列流行AI工具,現在都已經通過OpenUSD集成到Omniverse中。

就連Adobe,也計劃將Adobe Firefly作為API,提供在Omniverse中(就是估計會收費)。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

另一方面,英偉達還將生成式AI技術和OpenUSD結合,推出一些好用的AI工具。

例如ChatUSD,就是一個基於NVIDIA Nemo框架大模型Copilot,不僅可以回答開發者有關USD的問題,還能幫忙生成Python-USD代碼。

英偉達發佈最強AIGC芯片:生成式AI的iPhone時刻已來

又例如DeepSearch,也是一個基於大模型的新工具,基於文本或圖像輸入,可以快速對數據庫進行3D語義搜索。

在這次大會上,老黃先是回顧自己過去所做的“正確決定”——用AI重塑CG,為AI重新發明GPU。

隨後,他對未來AI行業的發展做大膽的展望:未來,幾乎所有事物的前方都會有一個大語言模型。“人”,將成為一種新的編程語言。

以工廠為例,老黃認為,未來的工廠將會由軟件和機器人來“主宰”。

像汽車這樣的產品,本身就是機器人,所以生產汽車的工廠,將會呈現出機器人制造機器人的場面。

看來,乘大模型東風迅速崛起的英偉達,這次是真的要ALL IN生成式AI。


相關推薦

2023-08-10

、協作等等,全部融合到一起。在這個時代裡,或許正如老黃的經典名言:“買得越多,省得越多!”英偉達最強AI超算再升級在5年前的SIGGRAPH上,英偉達通過將人工智能和實時光線追蹤技術引入GPU,重新定義計算機圖形學。老

2023-11-14

英偉達的節奏,越來越可怕。就在剛剛,老黃又一次在深夜炸場——發佈目前世界最強的AI芯片H200!較前任霸主H100,H200的性能直接提升60%到90%。不僅如此,這兩款芯片還是互相兼容的。這意味著,使用H100訓練/推理模型的企業

2024-03-19

界。今年的GTC峰會主題完全圍繞AI展開,2個小時的時間,老黃又一次帶來AI的變革時刻。當然除老黃的開幕演講外,後面還有900多場鼓舞人心的會議在等著你。同時此次GTC大會還吸引超過200傢展商,匯聚數千名不同行業領域的從

2022-10-24

看著最近老黃發佈的RTX40 系顯卡,等等黨好像還是沒有迎來曙光。你看看,已經有不少網友在網上給AMD提建議,讓他們搞快點,早點幹掉NVIDIA。過去幾年,遊戲佬的日子真的是挺折磨的。先是 20 系顯卡擠牙膏,沒

2023-09-01

其實很簡單,很多用戶都喜歡LCD,但是又會擔心LCD屏幕發黃發綠,色彩不夠精準,為解決這個問題,我們做很多努力,也嘗試很多方式,最終實現逐臺調校,讓它可以護眼、顯色兼得。核心配置上,iQOO Z8搭載聯發科天璣8200芯片

2023-12-03

近日,英特爾中國發佈酷睿Ultra處理器的預熱海報,並表示該處理器將於北京時間12月15日正式發佈。在發佈的海報上,英特爾官方表示,酷睿Ultra處理器就是裝在電腦裡的“最強大腦”,同時還著重強調該處理器核顯性能顯著提

2023-06-16

高通計劃於10月24日召開驍龍技術峰會,屆時將發佈最新款驍龍8 Gen3芯片。據悉,高通即將推出的驍龍8 Gen3 QRD工程機已經曝光安兔兔V10跑分,高達177W分。相比之下,天璣9200 的跑分為165W ,而驍龍8 Gen2的跑分為163W 。可以預見,驍

2023-06-16

高通即將在10月24日的驍龍技術峰會上發佈最新款芯片驍龍8 Gen3。近日,有消息稱驍龍8 Gen3 QRD工程機的安兔兔V10跑分已經曝光,高達177W分。預計驍龍8 Gen3將成為安卓最強芯。該芯片采用1 5 2架構設計,包含1顆Cortex X4超大核、5顆Co

2022-12-16

消息目前看來並不靠譜,因為該公司仍然要用其他產品來發佈最強大的M2芯片,但它仍然將是一個有趣的中期更新,加大的屏幕已經說明一切。截至目前還不清楚顯示屏會對這款新Mac的電池續航產生多大的影響。對於2023年,蘋果

2024-03-19

AI帶來的生產力變革,以及英偉達等一眾概念股的表現,老黃的演講已經變成全球資本市場翹首以待的熱門事件。在這場兩個小時的演講中,黃仁勛公佈搭載B200芯片的GB200 Grace Blackwell超級芯片系統,以及英偉達在AI軟件(NIM微服

2023-04-04

計算機DGX-1,來到OpenAI的辦公大樓。在現場人員到齊後,老黃拿出記號筆,在DGX-1的機箱上寫下這句話。與其一同前往的還有特斯拉和 OpenAI 的創始人,埃隆馬斯克。這次 OpenAI 之行,老黃不為別的,就是為把這臺剛出爐的超算送

2023-01-30

ChatGPT火,這個AI人工智能讓不少巨頭們紛紛下訂單,而老黃也是瞬間賣出1萬顆高端的顯卡。據產業鏈消息稱,蘋果、AMD、NVIDIA在AI領域競爭白熱化,傳出近期同步對臺積電下急單,相關芯片將在4月後逐步產出。業界提到,從算

2024-04-02

還記得前不久的GTC大會吧,老黃公佈B200時的狀態,可比發佈什麼“破4090”嗨多。想買老黃顯卡的人,從這裡排到法國。但,就從世超看來,老黃還真不一定高枕無憂,至少它的脖子被韓國人狠狠卡著。例如老黃最新發佈的B200芯

2023-03-22

一度的英偉達GTC大會如期而至!英偉達CEO黃仁勛(昵稱“老黃”)一如既往穿著標志性的皮衣進行78分鐘演講,滿面笑容地分享英偉達又悶聲幹哪些大事。總體來看,此次演講可總結成一大‘亮點’和一大‘重點’。‘亮點’是