精準縮水的NVIDIA三款中國特供AI GPU開始小批量供貨


美國對中國半導體技術的封鎖越來越嚴格,但是在商言商,NVIDIA始終沒有放棄中國市場,一直想盡辦法打造符合美國出口管制的中國特供版本,尤其是AIGPU,第二波三款正在到來。最早針對美國禁售A100、H100,NVIDIA設計特供版A800、H800,隻是閹割傳輸帶寬,算力絲毫不減。

但是很快,美國出臺新規,算力也做限制,A800、H800甚至是RTX 4090就都沒法賣。

為此,NVIDIA在遊戲卡市場設計RTX 4090D,已經低調上市。

而在AI加速領域,NVIDIA設計H20、L20、L2,原計劃2023年就發佈出貨,但為完全符合出口管制,推遲一段時間。

H20基於Hopper架構,是一款高性能的AI訓練卡,正是中國客戶亟需的,根據最新報道它已經開始小批量供貨給中國,第二季度上量。

H20的定價據稱僅為1.2-1.5萬美元,比華為昇騰910B 1.7萬美元要低不少,用心昭然若揭。

L20、L2均基於Ada Lovelace架構,均為AI推理卡,暫不清楚是否已經供貨,可能要稍等等,對於中國客戶而言也不是非常迫切的需要。

目前,三款新卡的最終規格已經確定,和之前曝光的基本一致。

H20的規格還是比較強的,INT8/FP8 Tensor算力為296T,BF16/FP16 Tensor算力為148T,TF32 Tensor算力為74T,FP32算力為44T,FP64算力為1T,功耗400W。

它具備60MB二級緩存、96GB HBM3內存,帶寬4TB/s,支持7路NVDEC、7路NVJPEG視頻引擎,還有著PCIe 5.0 x16系統接口、900GB/s NVLink互聯帶寬,支持最多7個MIG。

相比於H200,它少45GB HBM3,算力更是閹割得七零八落,INT8/FP8、BF16/FP16、TF32都少多達93%,FP64少足足97%,隻有FP32至少35%。

但即便如此,H20 FP32性能依然不如華為昇騰910B,這也是後者最大的優勢。

H20還可以八卡並行,組成一套HGX服務器,價格大約20萬美元,而之前八塊H800服務器需要大約28萬美元。

L20是雙插槽全高全長PCIe擴展卡,搭載96MB二級緩存、48GB GDDR6 ECC內存,帶寬864GB/s,INT8/FP8算力為239T,更高精度逐級減半,但不支持FP64,功耗275W。

L2則是單插槽半高卡,隻有36MB二級緩存、24GB GDDR6 ECC,帶寬300GB/s,算力進一步降低INT8/FP8 193T,FP32額外砍一半隻有24.1T。


相關推薦

2024-02-02

接受其中國特供版AI芯片H20的訂單,價格也已出爐。H20是三款中國特供版芯片中性能最強的一款。知情人士透露,英偉達最近幾周為中國H20經銷商的訂單設定的價格介於每顆1.2萬美元至1.5萬美元(約合8.5萬元至10.7萬元人民幣)之間

2023-11-10

屬實。英偉達的這三款 AI 芯片並非“改良版”,而是“縮水版”。其中,用於 AI 模型訓練的HGX H20在帶寬、計算速度等方面均有所限制,理論上,整體算力要比英偉達 H100 GPU芯片降80%左右,即H20等於H100的20%綜合算力性能,而且

2023-12-19

快科技12月19日消息,據國外媒體報道稱,英偉達已經做好準備,要在年底給中國用戶送上一份好禮(北京時間2023年12月28日晚上10點),而它就是RTX 4090 D。據悉,RTX 4090 D中國售價可能與之前的保持一致,還是12999元起步,但是性

2023-12-03

定價,即1599美元/2999元人民幣。但不管怎麼說,好消息是NVIDIA的旗艦遊戲顯卡即將回到中國,對遊戲玩傢來說是件好事。

2023-05-07

快科技5月6日消息,ChatGPT這樣的AI大模型火爆之後,多傢科技巨頭也入局搶占先機,推出自己的大模型,但這背後都需要龐大的算力支撐,NVIDIA的AI顯卡成香餑餑。據統計NVIDIA當前在售的加速卡至少有9款型號,其中高性能的有4款

2024-02-27

等競爭對手產品相當。H20顯卡是英偉達為中國市場開發的三款顯卡中最強大的一款。但H20的計算能力自然會低於英偉達的旗艦H100 AI芯片和此前英偉達針對中國市場的H800。據三位消息人士透露,H20的規格似乎也表明,它在某些關

2023-12-08

雖然受到美政府的嚴格約束,甚至被直接點名,但是NVIDIA仍將堅持在中國市場上推出特供版本的RTX4090D,具體時間很可能會在2024年1月底。RTX4090D仍將基於AD102GPU核心,但是編號從AD102-300變為AD102-250,對應著規格的降級。300變250具

2024-02-23

季度實現H200的首次批量出貨,預計發貨量會是H100的2倍。NVIDIA H200一直以來,在英偉達內部最大困擾是一個“凡爾賽”的問題:需求太大,供應鏈跟不上。從最初的遊戲圖形顯卡,到專業可視化,再到挖礦熱潮,再到如今的AI加

2023-03-23

PCIe,那麼NVLink互連帶寬就隻有300GB/s,PCIe 5.0則應該不會縮水。A800規格表H100規格表:精簡一下帶寬就是H800H100加速卡

2023-08-07

AI大模型,不惜加價搶購AI顯卡。在當前的市場上,隻有NVIDIA才能滿足AI顯卡的需求,AMD及Intel的AI顯卡不僅性能、生態上存在問題,而且供貨也跟不上,AMD的大殺器MI300X要到年底才能出貨,2024年才能大批量上市。歸根到底,這波

2024-05-26

快科技5月26日消息,英偉達因中國市場對其特供的AI芯片H20系列需求不佳,已經下調H20系列芯片的價格。據三位供應鏈人士透露,中國服務器經銷商目前以每組約人民幣10萬元的價格銷售H20芯片,而搭載八組芯片的服務器每臺售

2023-12-02

據國外媒體報道稱,英偉達正在加快準備中國特供市場的RTX4090D,其性能相比原版要下滑不少。按照之前的說法,RTX4090D將采用AD102-250芯片,與RTX4090的AD102-300/301相比,CUDA核心數量也會少於16384個。目前,RTX4090的TPP達到5286,所以

2024-03-13

近日市場傳言說國內互聯網大廠對於NVIDIAH20訂單未來可能大幅砍單。傳聞稱,主要是因有要求部分購買H20的企業要報備,需備註使用說明不用其他方案的原因”,從而擔憂H20會被砍單。這一消息似乎也影響NVIDIA的股價。上周五NVI

2024-04-01

作為一款中國特供版顯卡,RTX4090D嚴格限制超頻,也不能解鎖功耗,之前任何嘗試都隻能提升2-5%。但是現在發現,某廠商的RTX4090D已經偷偷解鎖,可以將最高功耗限制從425W提高到600W,然後就能大幅超頻。HKEPC測試發現,使用各