最近人們都在談論人工智能、數據中心和雲計算,記住GPU和CPU等處理器隻占服務器前期成本的20%左右是很有幫助的。這些處理器往往最受關註,因為必須首先選擇處理器,而正是這一決定推動服務器中其他一切的選擇,但它們隻是總成本的一部分,內存則占20%。但是,一臺服務器一半以上的成本還是來自於更為普通的產品。
那就是:印刷電路板(PCB)、無源元件、電纜、電源、硬盤驅動器和放置它們的機架,我們應該加上網絡,它的成本可能比所有其他元件都要高,但我們還是留到下次再說吧。那麼,誰來銷售所有這些設備,價值又從何而來?
特邀作者喬納森-戈德堡(Jonathan Goldberg)是多功能咨詢公司 D2D Advisory 的創始人。
這裡有兩類供應商--原始設備制造商和原始設計制造商--我們不打算拼寫首字母縮略詞,因為這實際上會混淆視聽。一般來說,原始設備制造商擁有品牌和最終客戶關系。原廠委托設計代工提供采購和制造,即所有設備的實際生產和組裝。在兩者之間,設計和系統集成領域有相當多的重疊,重要的是,原始設備制造商和原始設計制造商之間的界限是模糊的,在許多領域都有很大的交叉。
一段歷史。20 世紀 90 年代,隨著個人電腦制造商將生產基地從美國轉移到亞洲,這種模式應運而生。個人電腦品牌,即原始設備制造商將業務外包給主要位於臺灣的合同制造商。這些公司在臺灣生產設備,後來大量轉向中國。隨著時間的推移,合同制造商向價值鏈上遊移動,增加設計能力。合同制造商變成原始設計制造商,然後其中許多公司分拆成獨立公司,銷售自己的品牌產品,成為自己的原始設備制造商。這種模式逐漸演變成今天大多數大批量電子產品的生產方式。
服務器的發展速度略有不同。這些產品的產量較低,價格較高,因此 OEM(品牌所有者)可以更長時間地保留設計功能(有時是制造功能)。多年來,原始設備制造商與英特爾公司合作設計一系列服務器。然後,他們將這些產品銷售給客戶。雖然它們提供各種配置,但這些基本上都是目錄系統--客戶從可選項中挑選。
十餘年後,雲改變這一切。
最關鍵的是,公共雲提供商(又稱超大規模提供商)開始主導市場,不僅集中經濟實力,還集中技術能力。隨著時間的推移,超大規模企業在很大程度上摒棄原始設備制造商,直接與原始設計制造商合作,采購他們自己設計的系統。
如今,原始設備制造商主要包括惠普、戴爾和聯想。原始設計制造商有數百傢,但最大的都在臺灣,包括仁寶、富士康、英業達、廣達和緯創。這些公司都非常多樣化,在供應鏈中分佈著數十傢子公司。此外,還有一些其他委托設計代工公司,它們往往專註於特定的利基市場,例如時下的熱門股超微公司(SuperMicro),它們的專長是 GPU 服務器。
如今,超大規模企業與其他所有人之間存在著鴻溝。試想一傢大型企業,如銀行、快餐連鎖店或汽車制造商,他們可能仍然希望擁有自己的服務器,甚至數據中心。他們將與原始設備制造商合作,後者將為他們提供可供選擇的系統目錄。然後,原始設備制造商通常會充當系統集成商的角色--與所有供應商合作采購零部件、組裝印刷電路板,然後將所有設備連接在一起並安裝軟件。原始設備制造商在這裡扮演著重要的角色,因為很多采購決策都是由他們做出的。
相比之下,超大規模企業運營著數十個數據中心。他們的業務建立在巨大的規模經濟基礎上,如果能降低 5%的服務器成本,就能節省數億美元。除此之外,他們還擁有集中的技術人才。簡單地說,他們有能力雇用團隊來設計針對其特定需求進行優化的服務器。而其他大公司則沒有這樣的團隊,也不需要這樣的團隊,隻是運營規模不同而已。然後,超大型企業直接與原始設計制造商合作,由後者收集所有組件,組裝系統並佈線。在這裡,幾乎所有組件的購買決定都是由最終客戶做出的。
這給所有元件供應商帶來一個大問題。試想一傢芯片供應商。他們需要說服客戶購買他們的芯片,但客戶要的不是芯片,而是一個完整的工作系統。在他們同意任何大額訂單之前,客戶會希望測試該系統,確保它能很好地運行他們的軟件。因此,芯片供應商必須與 OEM 或 ODM 合作設計該系統。而這些設計是要花錢的。一個由 5-10 人組成的團隊需要一兩個月的時間來佈置一切、驗證性能並確保固件和軟件的兼容性。然後,還得有人購買元件來制造一些原型。
這些成本增加得很快,每個系統動輒幾十萬,通常達到七位數。因此,芯片供應商在銷售單個芯片之前,必須投入大量資金。客戶都希望服務器盡可能接近他們的需求,這意味著必須有人生產多個版本的服務器,因此成本會急劇上升。而這一切,都要在人們知道該平臺的銷售情況之前。
這個問題越來越嚴重。當隻有英特爾和 AMD 在銷售服務器 CPU 時,供應鏈的決策空間有限,而且都是成熟的供應商。而現在,CPU設計者多達十幾傢,組合難度大大增加。任何想進入人工智能加速器市場的人都必須面對所有這些成本。而對於較小的供應商來說,他們必須非常謹慎地對待自己的賭註。
投資於熱門芯片的支持,回報可能是巨大的,但投資於錯誤的平臺,回報則是巨大的損失。在向超級計算機銷售時,問題就更加突出。他們需要的遠不止幾個原型。他們有嚴格的測試周期,從十幾個系統到幾百個系統,再到幾千個系統。他們可能會為此付費(也可能不付費),但任何設計芯片的公司都需要比這更大的產量,才能證明測試系統的成本是合理的,更不用說整個芯片的成本。
當然,也有各種各樣的計劃來實現這些方面的標準化。開放計算項目的核心任務是實現服務器設計的標準化。雖然開放計算項目為業界做出一些重大貢獻,但我們認為沒有人會將其描述為通用標準。所有這些都將變得更加復雜。
數據中心日益多樣化,從純 CPU 到異構計算,這迫使所有供應商(不僅僅是芯片設計商)開始承擔一些重大風險。許多廠商會追逐每一筆交易,其他廠商則可能會重蹈覆轍,專註於 AMD、英特爾以及現在的 NVIDIA。聰明的廠商會采取投資組合的方式開展業務,並以類似對沖基金經理或風險投資者的方式監控自己的選擇。我們無意危言聳聽,這在很大程度上是電子產品周期性的自然規律。隨著時間的推移,該行業將找到一些新的平衡點,但未來幾年將更加混亂。