加錢掃貨、走私、裝甲車運輸,揭秘AI芯片背後的黑市風暴


去年9月,甲骨文董事長埃裡森、特斯拉CEO馬斯克,一起請英偉達創始人黃仁勛在矽谷一傢豪華餐廳吃日料。年屆八旬的埃裡森回想起那頓飯仍難以平靜。“席間埃隆(馬斯克)和我在乞求,我想用這個詞來形容我們再恰當不過。吃一個小時的壽司,也乞求一個小時。”

兩位以狂妄著稱的大佬甘願伏低做小,隻為能多分到一些“比毒品還難搞到”的英偉達GPU,最終兩人未能如願。

而另一傢矽谷巨頭思科為保護剛買來的英偉達GPU,幹脆動用裝甲車來運。

正如科幻作品《沙丘》將香料設定為宇宙最重要的資源。今天同樣可以大膽宣稱:誰掌握GPU,誰就掌握AI時代的命脈。

去年以來,在加速計算和生成式AI的帶動下,算力需求陡增。英偉達GPU作為提供算力的核心硬件,業界對其的需求早已“遠遠超過英偉達所能供應的極限”。

為獲得盡可能多的GPU,全球科技圈從貴族俱樂部化身為私酒時代的芝加哥,產品、流量與增長交織的史詩,讓位於充斥著貪婪、炫耀、諂媚與背叛的大模型舞臺劇。

從破產邊緣到80億美元估值

在過去一年,英偉達GPU極度短缺,全世界的大廠或創業公司都在各顯神通解決“芯荒”難題。

對中國企業來說,GPU短缺則是政策和產能兩方面造成的。

從2022年10月開始,英偉達就被禁止向中國出口A100、H100這兩款高端GPU。二道販子們敏銳地嗅到其中的商機。

一些企業從自傢機房裡把芯片禁令生效前購買的A100拆出來,賣給販子。這些沒有保修、沒有質保的舊芯片,非但沒有貶值,價格還從出廠時的8萬多元漲到10多萬元。

A100、H100分別由英偉達在2020年及2022年推出,上市時間並不長,其在國內市場的存貨相當有限。

另外,A100分為80GB、40GB兩個顯存版本,顯存越大,所能運行的神經網絡越大,訓練大語言模型效果越好。廠商都想買80GB顯存版本的A100,導致存貨更加緊缺。

因此,有一些黑心販子將A100的40GB版本改成80GB的來賣,很多急於購買的企業一時失察,買回去才發覺貨不對板。由於這類GPU來源特殊,上當的買傢根本沒有質保和維權的途徑,隻能吃啞巴虧。

可即便如此,低配置的二手A100在2023年依然供不應求。

過去一年,市面上英偉達GPU價格漲幅一度到200%。A100最火爆的時候,網傳最高成交價接近25萬元。按照這個價格,兩塊GPU就能換來一輛全新奔馳E級轎車。

二道販子賣機房拆來的A100賺差價,畢竟隻是小打小鬧。真正靠倒賣二手GPU發傢的,還要屬一傢名為CoreWeave的美國公司。

CoreWeave最開始是一傢“挖”比特幣的公司,其CEO回憶:“2016年,我們購買第一塊英偉達GPU,插上電源後,將其放在曼哈頓辦公室的臺球桌上,然後挖到以太坊網絡上的第一個幣。”

在生成式AI火爆之前,英偉達GPU除作為遊戲顯卡,最賺錢、最大的應用場景就是用於加密貨幣“挖礦”。因為GPU能以最快速度處理海量簡單重復的問題,天然就很適合用於晝夜不停地挖比特幣。

而CoreWeave的三位創始人,一開始也隻是將”挖礦”用於賺取額外收入,他們的本職工作是經營對沖基金和傢族辦公室。可由於2016年加密貨幣熱,他們的GPU越買越多,導致“華爾街的辦公桌上堆滿GPU”。

到2018年底,CoreWeave已經成為北美最大的以太坊“礦場”,擁有超過五萬塊GPU,占以太坊網絡總量的1%以上。

通過將英偉達GPU用作“礦卡”,CoreWeave在加密貨幣領域賺到第一桶金。但在2018年之後,市場行情急轉直下,加密貨幣大幅貶值,與加密貨幣深度綁定的CoreWeave也幾度面臨財務危機,險些倒閉。

到2019年,CoreWeave決定轉型做服務。

CoreWeave加入英偉達的雲服務提供商計劃,也就是圍繞英偉達的芯片構建專門的雲基礎設施。如果說英偉達是算力廠商,那CoreWeave就相當於算力經銷商。

到2022年底,ChatGPT發佈,生成式AI突然爆火,CoreWeave手頭數萬塊GPU成為硬通貨,因為GPU非常適合用於訓練AI大模型。它搖身一變,依靠手中積攢的GPU,向OpenAI、微軟、Inflection等眾多AI巨頭賣算力。

2023年4月,CoreWeave還獲得來自英偉達的B輪融資。黃仁勛在業績電話會上點名:“一大批新的GPU專業化雲服務提供商正在出現,最知名的當屬CoreWeave,他們做得非常出色。”

英偉達對“親信”CoreWeave可謂非常偏心。在一份研究機構Omdia披露出的英偉達H100供貨單中,CoreWeave獲得的H100數量,比特斯拉還多。

也正因為英偉達的“偏心”,除賣算力服務,CoreWeave以囤積的英偉達芯片為抵押,從黑石、Coatue等頂級機構獲得23億美元的債務融資。一舉將公司從破產邊緣,拉到投後估值80億美金。

冒高風險,買走私卡

不是誰都有CoreWeave這麼好的運氣。

跟英偉達關系不夠親密的企業,尤其是中小企業,購買“走私芯片”就成為一種無奈之下的選擇。

隨著全球AI大模型競爭愈發激烈,A100已經不能滿足一些企業的需求,性能更強勁的H100日趨搶手。

問題在於,H100實在太新,存貨更少。沒有存貨,二道販子也無處發揮,走私販子們登場。

走私販子們的來貨渠道主要有兩條:一是等英偉達向美國大型企業發貨後,搶購市場上的剩餘庫存;二是通過在印度、新加坡、馬來西亞等地註冊公司進口。

相比於隻有指甲蓋大小的微型芯片,H100的尺寸並不小。根據英偉達官方公佈的尺寸,H100整個芯片大小為814平方毫米,大概有兩個手掌大,走私販子隻能將H100放進背包,接受正式的過關安檢。


有走私販子透露,由於每個國傢把控嚴格度不一,如果把H100放在包裡,把它報成普通電子設備。

麻煩的是服務器架。H100需要插在服務器架上,才能用於訓練AI大模型。一套完整AI服務器要配置8塊H100,加上一臺超微電腦的服務器架,大約相當於一個保險櫃。

面對如此龐然大物,自然無法靠人肉背回。一般的做法是化整為零,將服務器拆開,用螞蟻搬傢地方式發回。至於運輸途中關鍵部件是否會損壞,運到目的地如何拼裝回去,一切都存在極大的風險。

H100在2022年3月剛發售時,售價折合人民幣約24.2萬元。如果在兩年前屯一批H100,什麼都不用做,每張到現在能凈賺6到9萬元。

在過去一年間,從朋友圈、小紅書等社交平臺,到拼多多、閑魚等電商平臺,再到各類垂直社區、垂直社群,有無數販子打出“H100現貨,手慢無!”、“稀缺H100現貨,先到先得!”、“原廠H100,見貨付款,欲購從速!”的標簽。

而如果進一步私聊,這些芯片販子會告訴你,產品沒有保修或支持服務,到貨最起碼需要6到8周,並且需要先付定金。如果問及發貨地和貨源,販子們大多會回答稱“海外發貨,大陸交付,可以送至指定地點。”

據買傢爆料,走中小型中間商渠道,風險很高。

首先,交定金,後續也可能因各種原因拿不到貨。其次,即使能拿到貨,諸如運輸過程中磕碰、泡水等現象,也時有發生,“碰到這種情況就隻能自認倒黴,根本不存在退貨一說。”

可即便如此,在各個社交平臺“H100預購從速”的帖子下方,仍然有成群結隊的用戶在咨詢價格。

搶購、加錢、售罄

購買走私GPU不是常態,對大公司而言,終究還是得跟英偉達做正經生意,從官方渠道購買A100、H100。

2022年的出口禁令下發後,經英偉達遊說,重新獲得出口許可。在2023年3月1日之前,英偉達可以繼續給中國大陸提供A100產品。

各傢科技巨頭趕緊行動,經歷“從搶購,到加錢,到售罄”的心路歷程。

據《晚點》報道,張一鳴在卸任CEO後,把工作重點放在研究AI上,不僅自己看AI相關論文,還經常跟一些字節高層分享論文學習心得,以及對ChatGPT的思考。高層對AI的重視,讓字節在提前搶購英偉達芯片時占得先機。

在GPT-4發佈後不到3個月,字節就被爆出,向英偉達訂購超過10億美元(約合人民幣71億)的GPU,到貨和沒到貨的A100和H800總計有10萬塊。考慮到2022年全年,英偉達數據中心GPU在中國銷售額大約100億元,也就是說,字節一傢公司的訂單,幾乎超過英偉達過去一年在中國的總銷量。

另一傢提前向英偉達下單,囤積GPU的巨頭是阿裡。據一位阿裡雲內部人士向《人物》透露,阿裡雲專門成立一個供應鏈團隊,其中有幾十人負責芯片采購,直接聽命於CTO。在阿裡雲前CEO張勇卸任之前,通義千問等AI項目都向他直接匯報。

提前搶購A100、H100最直接的好處是——省錢。因為英偉達芯片的漲價,實際上與大模型的發展息息相關。2022年在ChatGPT剛剛發佈時,大廠們普遍認為生成式AI很有潛力,但不成熟,不值得大批采購AI芯片。

但到2023年3月14日,OpenAI發佈GPT-4後,大廠和VC們終於意識到,GPT的顛覆性威力,以至於各界迅速形成共識——快搞大模型、快屯AI芯片!

也是從GPT-4發佈後,大模型賽道湧進大量熱錢,以及不差錢的大廠,英偉達芯片的價格也隨之水漲船高。大傢都必須加錢才能搶到芯片。

按照《人物》的描述:“來自美團的高管帶著采購團隊,把數百臺8卡A100服務器,像買白菜一樣全部掃走。盡管一臺機器的價格要大幾十萬,總訂單額過億,美團的人絲毫沒有猶豫,下單、簽合同、打預付款、提貨……流程飛快。”

再到後來,連加錢都買不到AI芯片。商業巨頭和小公司處境幾乎一致。

亞馬遜雲CEO亞當·塞利普斯基就表示:“H100是最先進的……可即使對於AWS來說也很難獲得。”

富士康董事長劉永偉也表示,過去一年隻有少數公司能獲得足夠的英偉達AI芯片來維持需求。在臺北富士康年度員工聚會上,劉永偉對記者表示:“當要滿足(AI芯片)需求時,也許需要建立新工廠。”

吃英偉達的剩飯

英偉達GPU像香料一樣,誘惑著越來越多人參與到這場爭奪中。

在2023年拉斯維加斯的CES科技大會上,AMD CEO蘇姿豐表示:“AI已是AMD的第一戰略重點。預計AMD最新推出的Instinct MI300加速卡,可以幫助AMD占領市場。”在介紹中,MI300X芯片是一款全面超越英偉達H100 AI芯片的產品。

投放市場後,MI300也迅速成為AMD歷史上銷售額最快達到10億美元的產品。

根據AMD財報,MI300芯片訂單的主要來源是微軟、Meta、甲骨文、Google、亞馬遜等大廠。與英偉達H100的客戶群體高度重合。

無怪乎《福克斯》認為:“如果業界還有英偉達潛在的對手,那一定包括蘇姿豐和她掌管的AMD。”

除AMD,老牌芯片巨頭英特爾也不想在AI時代掉隊。

在過去一年,英特爾CEO帕特·基辛格多次表示:“生成式AI不隻可以在英偉達芯片上運行。”雖然英特爾最先進的AI加速芯片Gaudi 2在性能上不及英偉達H100。但基辛格認為,Gaudi 2成本更低,主打價格優勢,可以在性價比方面縮小與H100的差距。

與此同時,英特爾還宣佈正在調整GPU策略,整合現有的Habana Labs、數據中心GPU兩大部門,於2025年推出新平臺“Falcon Shores”,進一步增強AI芯片設計能力。

按基辛格的說法:“以後的AI算力競爭一定會很有趣。”

甚至除老牌芯片巨頭,一大批半導體新生力量,也在試圖搶奪英偉達的市場份額。根據外媒報道,騰訊、阿裡等互聯網巨頭,已經有些“看不上”英偉達的特供版芯片,轉而尋求與國內GPU廠商合作。這些GPU廠商包括華為、燧原科技、摩爾線程等。

在黃仁勛最近的采訪中,連AMD都看不上的老黃表示:“在生產最好的AI芯片的競爭中,華為是英偉達非常強大的競爭對手之一。”

而諸如燧原科技、摩爾線程等第二梯隊國產GPU公司,也在2023年拿到數十億元不等的大額融資。

這一切變化都源於,全球企業都在尋找英偉達GPU的替代品。畢竟,英偉達的GPU再好,隻有能用上才是真好。單是英偉達滿足不的市場需求,已經足以喂飽一大批GPU新興企業。

但要取代英偉達又談何容易?

造成英偉達GPU短缺最根本的原因在於,GPU是一種極端復雜的產品,需要世界上最先進的生產工藝,目前隻有臺積電能夠加工生產,而臺積電的產能是有限的。

目前H100都由臺積電代工,使用4納米工藝(A100使用的是7納米),從開始生產到出售給客戶,H100中間經歷的生產、包裝和測試環節,一共需要6個月左右。

根據GPU Utils發佈的一份研究報告,制約GPU擴大生產的一個主要瓶頸,是所謂的CoWoS封裝技術。

CoWoS可以拆分成“CoW”和“WoS”來看。“CoW(Chip-on-Wafer)”指芯片堆疊;“WoS(Wafer-on-Substrate)”則是將芯片堆疊在基板上。CoWoS就是把芯片堆疊起來,再封裝於基板上,最終形成2.5D、3D的型態,減少芯片的空間,同時減少功耗和成本。CoWoS封裝技術目前的月產量也就1萬片左右。

臺積電可不止為英偉達代工,AMD以及博通、思科和賽靈思等都同樣在使用CoWoS封裝技術制作芯片。

產能瓶頸限制GPU供應的難題,在短期內是無解的。即便如AMD設計出強大的MI300加速卡,歸根結底還是要找臺積電代工,臺積電就算把給英偉達的產能給到AMD,等於市場上GPU的總量其實沒有增加。

與此同時,英偉達真正的壁壘,並不隻有GPU硬件性能,還在於其龐大的AI軟件生態CUDA。

簡單來說,決定GPU使用效果的不隻是本身性能,還包括配套軟件和開發工具對應用的支持。目前英偉達定義GPU通用計算編程框架CUDA,開發者們早已習慣用CUDA專有的編程語言,制作GPU驅動的應用程序。

如果開發者要遷移到Google、亞馬遜、微軟或國產的GPU,他們甚至需要學習全新的軟件語言,遷移成本顯然很高。

但後發廠商完全不必妄自菲薄,正如中國工程院院士、清華大學計算機系教授鄭緯民所言:“今天國產AI芯片隻要達到國外芯片60%的性能,如果生態做好,客戶也會滿意。”

隻是在達到英偉達GPU 60%的性能之前,企業們看起來先選擇以拆舊貨、走私、搶購、加錢掃貨等方式,緩解自身的AI芯片荒。


相關推薦

2024-08-17

公司合作,聯合推出一系列面向軍政界、平民的Cybertruck裝甲車”。據介紹,該系列車型專為對性能、防護和能源獨立性有最高要求”的用戶而設計,名為STING”,號稱能在最惡劣的環境中正常使用。STING”系列提供三種不同配置

2022-07-30

“開空調,要加錢!”近期,一張網約車內的圖片在社交網絡上迅速傳播。炎炎夏日,乘客因空調與司機發生爭執的事件屢見報端。爭執的背後,既有乘客汗流浹背的不適,又有網約車司機的無奈。為何有的司機不開空調?“開

2023-11-08

是展示小型機器人如何支持士兵完成一系列任務,包括與裝甲車輛交戰。海軍陸戰隊使用的機器人身份尚未確定,但與售價約 5000 美元的 Unitree 四足機器狗十分相似。據一位發言人稱,該機器人太輕、太脆弱,而且電池續航能力

2022-09-15

資料圖據悉,該計劃旨在打造一種具有開創性設計的新型裝甲車 —— 至少從字面上來看是這樣的。有趣的是,新公佈的這輛 MPF 輕型裝甲車,也是由 M1 坦克的設計者 —— 通用動力陸上系統公司(General Dynamics Land Systems)——

2024-05-24

真正的好榴蓮相提並論。此外,這些榴蓮在采摘、保存和運輸過程中可能沒有得到妥善處理,品質更是大打折扣。面對這一現象,B太呼籲消費者要保持警惕。他強調,真正的好榴蓮是需要付出相應成本的。從種植、采摘到運輸

2023-02-28

理系統控制--該系統已經用於其他自主平臺,包括M113自主裝甲車和噴氣動力的MQ-28幽靈蝙蝠忠誠僚機無人機。這可以從地面站運行,也可以從直升機上控制Strix,以擴大其能力並在高威脅環境中保護空中人員。BAE系統公司澳大利

2023-02-13

隨著ChatGPT的爆紅,微軟、Google、百度相繼宣佈對他們的搜索引擎進行重大改革,試圖將大型人工智能模型整合到搜索中,以便給用戶提供更豐富、更準確的體驗。但是興奮之餘,新工具背後可能隱藏著一個“骯臟的秘密”。外

2022-10-13

間,美國陸軍以“Big 5”理論為基礎,即圍繞主戰坦克、裝甲車輛、攻擊和通用直升機以及反導彈系統建立軍隊,作為對抗華沙條約組織龐大武裝力量戰略的一部分。蘇聯解體後,美國陸軍轉向一支更具機動性的綜合部隊,它更

2024-04-30

受美國禁令的影響,英偉達(NVIDIA)已上市最高端的AI芯片H100此前在國內市場價格持續大漲,但是近期搭載H100的AI服務器在國內的現貨價卻快速下跌超過10%。雖然美國針對AI芯片有出口禁令,但仍有部分經銷商鋌而走險,通過一

2023-09-14

快科技9月13日消息,伴隨著iPhone 15 Pro的發佈,蘋果A系列全新處理器正式與大傢見面。這一次命名很有意思,不叫A17 Bionic,而是叫A17 PRO。這也是蘋果首次以PRO來命名處手機芯片,也是蘋果歷史上最強大的手機芯片。此前拆解過

2024-03-26

以恢復服務。據采訪顯示,星鏈設備通過有組織的網絡被走私進入當地。星鏈終端首先在迪拜註冊,然後通過飛機運送到烏幹達,最後通過南蘇丹的公路運往蘇丹。在南蘇丹和中非共和國交界的偏遠地區,尼亞拉市的商人已經開

2023-11-01

新能源汽車銷量的總冠軍。而出口數量的增加,也催生汽車運輸船的需求,面對蜂擁而來的汽車出口訂單,汽車運輸船也成為車企和貨運公司的緊俏貨。據報道,9月12日,中國船舶集團旗下的廣船國際聯合中船貿易成功交付一艘

2022-07-28

裸貸、自殺、暴利催收,校園貸往事重新噴湧,趣店羅敏一次次被質問:“帶血”的預制菜,還會有人食?7月17日,為“1分錢酸菜魚”搖旗吶喊的兩位明星紛紛道歉,並表示不會再和趣店合作。曾被稱為“人間清醒”的寶媽代

2023-09-03

跨境客車進行查驗時,發現機檢圖像異常,存在改裝藏匿走私嫌疑。經進一步車體檢查,關員在該車底盤改裝的暗格內查獲手機電容筆1100支,舊手機829部,手機屏幕8塊。目前,該案已按規定作進一步處置。從海關官方公佈的圖