差異化競爭:英偉達人工智能GPU的挑戰者們


英偉達是雲計算領域的早期領導者,主要是因為其專有的計算統一架構(“CUDA”)平臺,可在其GPU上進行通用處理。該公司已成功在迅速擴大的雲計算人工智能市場占有一席之地。AlphabetInc、Google和亞馬遜和亞馬遜公司已在某些情況下部署自己的專有AI芯片,但也在不斷轉向英偉達。但現在,英偉達正面臨著英特爾和AMD的競爭,這兩傢公司也在積極開拓這一細分市場。

此外,還有眾多獲得大量風險投資的人工智能芯片初創公司選擇不與英偉達競爭,另辟蹊徑,走一些差異化路線,試圖在市場上分得一杯羹。對此,分析師Robert Castellano做分析。

英偉達的主導地位

英偉達上調年度業績預期,預計第三財季營收將達到160億美元左右。這一數字大大超過外界一致預測的126.1億美元,與去年同期相比增長 170%。

下圖顯示英偉達的數據中心收入增長情況,表明市場對其芯片的需求以及對Arm的連帶效應。分析師預計2024財年第三季度(2023財年第三季度)的營收將環比增長21%,該財報將於2023年11月 21日公佈。


本季度,英偉達預計每股收益為3.34美元,與上年同期相比大幅增長+475.9%。

本財年的一致預期收益為10.74美元,與上一財年相比大幅增長221.6%。這一數據表明,人們對英偉達本財年的財務業績有著強烈的增長預期。


雲超級擴展器

近年來,雲計算市場在采用基於Arm的處理器方面取得一些顯著進展。Arm 聲稱,其在雲計算市場的份額已從2020年12月31日的7.2%上升到10.1%,這主要歸功於亞馬遜越來越多地使用其內部Arm芯片。2021 年,亞馬遜網絡服務(AWS)已在15%的服務器實例中部署其定制的Graviton芯片,這標志著這傢雲計算巨頭正大幅轉向Arm架構。

Google

Google報告稱,雲計算收入增長22%,達到84.1億美元,低於預計的86.4億美元。6月份,Google的雲計算業務增長28%。

2023年,Google發佈最新的自主研發芯片TPU V4,其性能比上一代芯片顯著提高2.1倍。通過集成4096個這樣的芯片,超級計算性能大幅提升10倍,令人印象深刻。

Google表示,在規模相當的系統中,TPU V4的性能是英偉達A100的1.7倍,能效也提高1.9倍。與前代產品TPU V3相似,每個TPU V4由兩個張量核 (TC) 單元組成。每個TC單元由四個128x128矩陣乘法單元(MXU)、一個配備128個通道(每個通道包含16個ALU)的矢量處理單元(“VPU”)和16 MiB的矢量存儲器(“VMEM”)組成。

除下一代TPU,Google還在2023年底開始向開發人員全面提供英偉達的H100 GPU,作為其A3系列虛擬機的一部分。

亞馬遜AWS

在過去的六個季度裡,亞馬遜網絡服務部的業績一直在下滑,但第三季度的業績卻趨於穩定,保持12%的同比增長。該部門的營業收入也同比激增29%,達到約70億美元。

今年5月,AWS推出基於英偉達 H100 GPU的EC2 P5虛擬機實例。該配置包括八個英偉達 H100 Tensor Core GPU,每個都配備640 GB的高帶寬GPU內存。它還擁有第三代AMD EPYC處理器、2 TB系統內存、30 TB本地NVMe存儲、令人印象深刻的3200 Gbps總網絡帶寬以及對GPUDirect RDMA的支持。後者可實現節點與節點之間的直接通信,無需使用CPU,從而降低延遲,提高橫向擴展性能。

此外,亞馬遜EC2 P5實例可部署在第二代超大規模集群(稱為亞馬遜EC2 UltraClusters)中。這些集群包括高性能計算、網絡資源和雲存儲。這些集群可容納多達20,000個H100 Tensor Core GPU,使用戶能夠部署參數高達數十億或數萬億的機器學習模型。

微軟公司

微軟的雲計算收入增長24%,9月份達到318億美元。在微軟的三大業務部門中,智能雲的表現最為突出,收入增長19%,達到243億美元。該部門包括服務器產品和雲服務,其中Azure實現29%的強勁增長,超過華爾街的預期的26%。

今年3月,微軟在一篇博客文章中宣佈,計劃對Azure進行重大升級。此次升級將采用數以萬計的英偉達尖端H100圖形卡,以及速度更快的InfiniBand網絡互連技術。

ND H100 v5實例還采用英特爾公司最新的第四代英特爾至強可擴展中央處理器,並通過英偉達的Quantum-2 CX7 InfiniBand技術實現低延遲聯網。它們還采用PCIe Gen5,為每個GPU提供每秒64千兆字節的帶寬,以及可實現更快數據傳輸速度的DDR5內存,以處理最大的人工智能訓練數據集。

成功的初創企業

ChatGPT等應用進一步鞏固英偉達在人工智能行業的地位。其GPU芯片已成為各種人工智能應用的關鍵。因此,任何希望在這一領域挑戰英偉達的初創公司都面臨著巨大的壓力,因為英偉達已經確立自己的技術的主導地位和可靠性。

Cerebras

英偉達的A100 GPU已經相當可觀,芯片面積826平方毫米。相比之下,Cerebras的新WSE-2芯片則非常巨大,面積達45225平方毫米,基本上覆蓋8英寸矽晶片的整個表面。自2016年成立以來,Cerebras已成功獲得7.3億美元的融資。根據CB Insights全球獨角獸俱樂部的數據,該公司目前的估值為40億美元。

Cerebras與Abu Dhabi的G42合作,建造九臺人工智能超級計算機中的第一臺,該項目耗資超過1億美元。此外,Cerebras還在生成式人工智能領域積極尋找機會。雖然它的CS-2模型在GPT環境下的訓練速度令人印象深刻,但尚未獲得業內主要制造商的采用。

SambaNova

SambaNova成立於2017年,是人工智能芯片行業中資金最雄厚的公司之一。它已成功融資10億美元之巨,其著名支持者包括軟銀和英特爾。這不僅使SambaNova成為融資最多的AI芯片初創公司,也使其成為英偉達最強大的新興競爭對手之一,估值高達50億美元。

SambaNova最近推出最新的第四代SN40L處理器。這款尖端芯片采用臺積電先進的5納米工藝制造,擁有超過1,020億個晶體管,計算速度高達638 teraflops。它采用獨特的三層內存系統,包括片上內存、高帶寬內存和大容量內存,所有這些設計都是為高效處理與人工智能工作負載相關的大量數據流。SambaNova聲稱,一個節點中僅有八個這樣的芯片就能支持多達50萬億個參數的模型,幾乎是OpenAI的GPT-4 LLM報告的三倍。

Tenstorrent

Tenstorrent是人工智能芯片行業的另一傢著名初創公司,成立於2016年。迄今為止,該公司已獲得近3.35億美元的融資,最近還獲得三星和現代汽車等大公司的投資,目前估值約為10億美元。

Tenstorrent正瞄準挑戰英偉達在人工智能領域的主導地位,開發采用RISC-V和Chiplet技術的人工智能CPU。值得註意的是,該公司最近與三星達成生產合作,打算利用三星先進的4nm工藝制造芯片。這一合作彰顯Tenstorrent致力於推動其技術發展並參與人工智能芯片市場競爭的承諾。

不太成功的初創企業

Graphcore

Graphcore在歐洲半導體初創企業領域,尤其是在資金募集方面取得顯著成績。該公司由Nigel Toon和Simon Knowles於2016年創立,專註於開發智能處理單元(IPU),有別於人工智能應用中普遍使用的GPU(圖形處理單元)。Graphcore聲稱,其IPU技術在滿足人工智能的特殊要求方面比GPU具有明顯優勢。

PitchBook數據顯示,Graphcore已成功獲得超過6億美元的投資。然而,盡管獲得大量資金,該公司的收入仍然相對有限。這種情況在2020年發生重大轉變,當時微軟決定停止在其雲計算中心使用Graphcore的芯片,導致該公司失去一個主要客戶,並帶來更嚴峻的挑戰。

據《金融時報》報道,到2022年,Graphcore的收入將驟降46%,僅為270萬美元。同時,其稅前虧損增加11%,達到2.046億美元,年終現金餘額為1.57億美元。Graphcore表示 需要額外融資才能在次年5月實現收支平衡。該公司將這一挫折歸因於“不利的宏觀經濟環境”以及“主要戰略客戶”(尤其是中國的重要客戶)硬件采購的延遲。

目前,Graphcore正在調整其業務戰略,將其IPU芯片從數據中心過渡到雲計算環境,這一轉變是公司為適應半導體行業不斷變化的市場動態和挑戰而做出的戰略調整。

GSI技術公司(GSIT)

GSI Technology是Gemini關聯處理單元(“APU”)的開發商,為網絡、電信和軍事市場提供人工智能和高性能並行計算解決方案。

如表1所示,Gemini-I的性能優於其他類型的處理器。Gemini-I芯片每600MHz時鐘周期可執行200萬x 1位運算,內存帶寬為26TB/秒,而英特爾至強8280在2.7GHz頻率下可執行28 x 2 x 512位運算,內存帶寬為1TB/秒。


2024財年第二季度,公司凈虧損410萬美元,凈收入為570萬美元,相當於攤薄後每股0.16美元。這一業績與2023財年第二季度凈虧損320萬美元,攤薄後每股虧損0.13 美元,凈收入900萬美元形成鮮明對比。此外,在2024財年第一季度,公司的凈虧損為510萬美元,攤薄後每股虧損0.21美元,凈收入560萬美元。

2024財年第二季度的毛利率為54.7%,低於上年同期的62.6%,也略低於第一季度的54.9%。該數據顯示公司在特定時期內的財務業績和利潤趨勢。

Mythic

Mythic是一傢專門從事人工智能芯片仿真的著名公司,專註於計算機內存(CIM)技術。然而,據科技網站The Register的報道,這傢人工智能芯片初創公司在融資方面面臨重大挑戰。盡管該公司最初籌集約1.6億美元的資金,但在過去一年中遇到財務困難,甚至瀕臨停止運營的邊緣。

幸運的是,2023年3月,Mythic成功獲得1,300萬美元的投資,從而得以繼續運營。Mythic的首席執行官Dave Rick表示,英偉達雖然間接地造成更廣泛的AI芯片融資困境。這是因為投資者往往傾向於那些有可能獲得豐厚回報的機會,這就為Mythic這樣的AI芯片初創企業獲得運營所需的資金創造一個充滿挑戰的環境。

Rivos

服務器芯片制造商Rivos發現自己陷入與蘋果公司的法律糾紛中,蘋果公司被指控非法招募Rivos的工程師並盜用商業機密。2023年8月,Rivos公司不幸采取以下措施裁員約20人,約占公司員工總數的6%。在此過程中,管理層向其餘員工透露,公司獲得新資金的前景越來越暗淡。

英偉達投資

芯片初創企業的風險投資正在經歷前所未有的下滑,這主要歸因於英偉達在人工智能芯片市場的主導地位。來自美國的數據顯示,芯片初創企業的交易量與前一年相比下降80%,降幅驚人。

PitchBook的數據顯示,截至8月底,美國芯片初創企業已籌集到8.814億美元。相比之下,2022年前三個季度的融資額為17.9億美元。截至8月底,交易數量從23筆下降到4筆。

不過,英偉達一直是其自身投資領域的中心。圖3顯示自ChatGPT發佈以來,截至2023年10月23日的Pitchbook數據,其中包含最重要的戰略投資。除兩傢公司外,英偉達都是其他公司的投資者。

英偉達一直是最活躍的投資者,不僅在按規模計算的頂級投資中如此,在總體數量上也是如此。在2022年11月至2023年10月期間進行的所有投資中,近一半的投資都有英偉達的身影。

英偉達的投資戰略似乎主要集中在成長期公司,超過75%的投資都投向這一領域。值得註意的是,在此期間,他們參與10筆最大融資中的8筆。基礎設施/LLM(Likewise Learning Models)是他們獲得投資的主要領域,占其投資總額的近一半。醫療保健/治療領域是英偉達下一個最重要的投資領域。

投資者啟示

目前看來,任何新興公司都不太可能成為與行業巨頭英偉達和AMD並駕齊驅的GPU市場第三大參與者。即使是芯片業的霸主英特爾公司,在試圖開發出受遊戲玩傢歡迎的高端GPU時也遇到挑戰。英特爾的下一個獨立GPU計劃將於2025年發佈。這種情況凸顯英偉達和AMD在GPU市場上的強大地位,預計在不久的將來競爭將非常有限。

事實證明,GPU是處理像GPT-3這樣的大型語言模型(LLM)所需的大量計算的理想硬件,這可能涉及到大量參數的訓練,如GPT-3的1750億個參數。英偉達 通過開發和擴展Cuda軟件平臺,戰略性地鞏固自己在這一領域的地位。Cuda提供一系列專有庫、編譯器、框架和開發工具,為人工智能專業人士提供構建模型所需的工具。最重要的是,Cuda是英偉達 GPU的獨占產品,這種軟硬件的融合大大降低客戶在人工智能領域的轉換成本,增強英偉達的競爭優勢。

即使有芯片競爭對手生產出與英偉達的GPU不相上下的產品,分析師也有理由認為,已經在CUDA上構建的代碼和模型可能不會輕易轉移到不同的GPU上。這使得英偉達擁有固有的優勢。雖然有可能出現不依賴Cuda或英偉達 GPU的替代方法,但截至2023年,英偉達在這一領域面臨的競爭微乎其微。因此,任何從事LLM開發的企業在等待替代方案的同時,都有可能因英偉達繼續主導該領域而落後。

在評估芯片行業的競爭格局時,很明顯,英偉達面臨著多個競爭者和潛在威脅:

AMD:AMD是一傢資金雄厚的芯片制造商,擁有強大的GPU專業技術。然而,其在軟件方面的相對弱勢可能會阻礙其與英偉達的有效競爭。

英特爾:雖然英特爾在人工智能加速器或GPU方面尚未取得太多成功,但它的實力不容小覷。作為半導體行業的主要企業,英特爾擁有在這一領域取得重大進展的資源和能力。

超大規模企業的內部解決方案:Google、亞馬遜、微軟和Meta Platform等公司都在開發自己的內部芯片,如TPU、Trainium和Inferentia。雖然這些芯片可能在特定的工作負載中表現出色,但它們可能無法在廣泛的應用中超越英偉達的GPU。

雲計算公司:雲計算提供商需要提供各種GPU和加速器,以滿足運行人工智能工作負載的企業客戶的需求。雖然亞馬遜和Google可能會將內部芯片用於自己的人工智能模型,但說服廣大企業客戶為這些專有半導體優化其人工智能模型,可能會導致供應商鎖定,而這正是企業通常會避免的情況。

盡管存在這些競爭力量,但預計企業客戶將繼續要求中立的商用GPU供應商。在可預見的未來,英偉達有可能繼續保持市場領先地位,這主要得益於其強大的軟硬件集成能力、CUDA軟件平臺的廣泛采用以及與其技術相關的大量客戶轉換成本。這些因素共同構成英偉達的競爭優勢,有助於鞏固其在人工智能芯片市場的地位。


相關推薦

2022-07-06

IDIA GPU的CUDA生態成功克服訓練效率難題並成功掀起這一代人工智能潮流之後,NVIDIA的GPU一直是訓練市場的首選芯片。上周MLperf公佈的最新訓練榜單也再次印證NVIDIA的穩固地位。MLPerf是由機器學習業界的行業組織ML Commons牽頭做的

2023-04-07

下,三星獵戶座在性能和能效、工藝和架構上全面落後於競爭對手,在今天智能手機市場的“紅海”中,繼續搭載隻會拉低旗艦產品的競爭力。三星也不是躺平任嘲。不僅是轉向更先進的 Arm 公版,三星和 AMD 在 2019 年就在手機 G

2024-02-26

之一,且相較前一年下降46%,虧損達到2億美元。 2023年,人工智能浪潮爆發,英偉達業績再度暴漲。 H100一卡難求之時,Graphcore以為自己至少能撿到英偉達的漏,結果卻連湯都沒喝著。去年,Graphcore的創始人Nigel Toon向英國首相寫

2024-03-28

術的進化,以GPT、Gemini為代表的大模型繼續向著AGI(通用人工智能)迭代;二是現象級應用的湧現,生成式AI在不同領域、不同場景下的應用狂潮在逐步改變人類的生活和工作方式,比如雷科技尤其關註的AI硬件領域,就出現AI手

2024-02-22

其總市值達到1.67萬億美元,投資者們押註該公司仍將是人工智能計算熱潮的最主要受益者。英偉達首席執行官黃仁勛表示:“GPU加速計算和生成人工智能可謂已經達到‘臨界點’。”“全球各公司、行業,乃至多數國傢的需求

2024-03-07

從應用場景上解讀,強調美國對華AI芯片算力的遏制,卡人工智能大模型的升級。誠然,這兩個解讀維度都有很強的說服力。但如果考慮到美國商務部半年多以來對華半導體技術路線調研的焦慮,尤其是華為Mate60的上市,代表中

2024-03-01

而這些大型語言模型正是推動整個科技行業變革的生成式人工智能系統的基礎。如今,英偉達已崛起成為科技界的巨頭,其股價飆升,牢牢掌握著這個時代最具影響力、也最具爭議的技術。在《連線》雜志的“設備實驗室”(Gad

2024-02-27

持久。另一個問題是,主宰這一市場的英偉達能否經受住競爭的沖擊,包括來自其一些最大客戶的競爭。關於第一個問題,近幾周來,芯片行業的大咖們在預測生成式AI將帶來的需求方面,一直表現得比其他人更大膽。作為英偉

2024-02-13

繼日前傳言英偉達將入局定制芯片業務之後,人工智能熱潮又將英偉達推向一個新高峰。據報道,隨著英偉達股價達到734.96美元的歷史新高,公司市值達到1.82萬億美元,而零售巨頭亞馬遜的市值為1.81萬億美元,這意味著公司躍

2023-12-02

個數字每個月還在不斷攀升。Arm全球的生態也是滿足客戶差異化需求的關鍵所在,在Neoverse CSS 的基礎之上,Arm推出全面設計 (Arm Total Design) ,進一步結合生態系統的力量,簡化定制芯片的開發流程,並且讓交付變得更加容易、便

2023-11-14

大規模與高性能計算副總裁Ian Buck表示——要利用生成式人工智能和高性能計算應用創造智能,必須使用大型、快速的GPU顯存,來高速高效地處理海量數據。借助H200,業界領先的端到端人工智能超算平臺的速度會變得更快,一些

2024-02-22

傢公司就可能產生宏觀效應的程度” 。而對於身處這場人工智能革命的每個人來說,此次英偉達超預期的業績表現更像是對AI技術持續發展的鼓舞和提振——最強的芯片依舊供不應求,更多公司在前進,蓬勃的市場迫切需要更多

2023-11-14

周一,半導體行業巨頭英偉達發佈新一代人工智能(AI)芯片H200,這款芯片旨在針對各種AI模型進行訓練和部署。H200芯片是目前用於訓練最先進的大型語言模型H100芯片的升級版,配備141GB的內存,特別擅長執行“推理”任務。在

2022-06-28

Christiano Amon)對《金融時報》表示,將與英特爾或三星等競爭對手成立一個財團,對ARM進行控股,或者將其全盤收購。英偉達也曾在2020年嘗試過以400億美元收購ARM,但未能成功。部分英國政客認為,ARM擁有極其重要的戰略地位