耕耘多年後,基於Arm架構的CPU在服務器市場迎來大幅增長,被眾多客戶喜歡並采用。超大規模雲服務商如亞馬遜雲服務(AWS)、阿裡巴巴、微軟等自研CPU,都選擇和Arm合作,這是為什麼?
“答案非常簡單,通過和Arm合作,他們能夠根據自己的用例和基礎設施來打造並優化解決方案。”Arm高級副總裁兼基礎設施事業部總經理Mohamed Awad在2023 Arm Tech Symposia年度技術大會上表示。
與超大規模雲服務商同樣喜歡Arm服務器CPU可定制化特性的還有最重要的AI芯片提供商之一——英偉達。
在英偉達強大的GH200超級芯片中,包含72顆Arm Neoverse核心,加上英偉達的GPU,GH200的AI性能較基於x86架構的系統可提升10倍。
為滿足更多客戶在基礎設施建設中的定制化需求,Arm還有兩個重要舉措。
為什麼首選Arm Neoverse CPU?
GH200 Grace Hopper 超級芯片平臺是英偉達今年5月發佈的產品,專為處理海量的生成式AI任務而設計。擁有256個GH200超級芯片的NVIDIA DGX GH200超級計算機,其AI性能提升到驚人的Exaflop(每秒一百萬萬億次次算)級別。
如此強大的AI性能,關鍵在於系統架構的變革。
基礎設施領域的傳統系統架構
傳統的服務器系統架構,內存通過PCIe,連接一個通用現成的CPU(也就是Host CPU),負責管理多個加速器。
“這種傳統架構是過去市場上唯一可用的架構。”Mohamed Awad指出,“這個架構的問題在於,通用現成的CPU以及加速器之間的接口直接限制產品最終的性能水平。因為所有的加速器都必須通過這個通用現成的CPU訪問額外的內存,無法達到內存的一致性,加速器的性能無法被充分利用,也就無法很好地支持生成式AI的需求。”
面向新的應用需求,基礎設施領域出現現代化的系統架構
GH200超級芯片改變傳統架構,通過NVLink,讓每一個CPU都單獨和一個加速器相連,實現較強的內存一致性。其中的關鍵點之一就是可客制化的 CPU,為此,借助這樣的架構,英偉達能夠充分發揮GPU的效率,根據實際場景和用例實現性能的最大化。
“隻有解最終用例,並且根據使用場景針對性地設計CPU,才能獲得更好的效率,達到產品最佳的表現性能。”Mohamed Awad進一步表示,“英偉達攜手Arm,借助Arm技術帶來的靈活性,設計出他們所需要的芯片以進一步優化系統,同時充分利用Arm強大的軟件生態系統。”
接下來的問題是,英偉達提出的這種架構會成為生成式AI時代的主流嗎?
“現在判斷一個CPU對一個 GPU 作為加速器是不是未來的主趨勢,或唯一趨勢,仍為時尚早。”Mohamed Awad對雷峰網表示,“我們正處於計算加速的時代,在未來的架構當中,不管通過什麼方式耦合,任何的通用CPU旁邊都一定會有一個加速器。Arm的獨特之處在於,能夠幫助合作夥伴從頭開始、根據所需構建定制化的 CPU,做好CPU和加速器之間的連接。”
由於x86提供的是標準的CPU芯片,所以GH200超級芯片平臺中CPU最佳的選擇隻有Arm CPU,這也是Arm Neoverse受到歡迎的關鍵。
也就是說,標準化的CPU不能滿足基礎設施的定制化需求,可定制化成Arm在服務器市場的殺手鐧。
可定制化,Arm在服務器市場的“殺手鐧”
今年八月,Arm推出Arm Neoverse計算子系統 (CSS),促使Arm生態系統通過更低的成本、更少的風險以及更短的時間,打造出專用芯片。
Arm CSS的第一代產品Arm Neoverse CSS N2集成Neoverse N2 平臺,並通過驗證配置且優化功耗、性能與面積 (PPA)。
“通過Neoverse CSS能夠幫助我們的合作夥伴進一步降低投資,加速整個生態系統對我們解決方案的可訪問性,同時加速合作夥伴產品的上市時間。”Mohamed Awad表示。
雷峰網(公眾號:雷峰網)解到,有Arm的客戶通過使用Neoverse CSS,節省長達80人/年的工程師時間。還有客戶用Neoverse CSS,項目從概念到流片僅用13個月。
微軟近期發佈的Cobalt 100 CPU,也是基於Neoverse CSS。
“Arm Neoverse 在中國市場,特別是基礎設施領域,有很多客戶,過去三、四年發展也非常強勁。”Arm 中國區業務全球副總裁鄒挺說,“Arm 也積極參與數據中心、雲計算等本土的生態、開源軟件社區,包括龍蜥社區等,幫助這些社區能更好地融入Arm全球生態系統中。”
Mohamed Awad也強調,中國是Arm非常重要的市場之一,中國合作夥伴基於Arm架構芯片的總出貨量已累計達300億顆,Arm在中國有近400傢技術授權客戶,這個數字每個月還在不斷攀升。
Arm全球的生態也是滿足客戶差異化需求的關鍵所在,在Neoverse CSS 的基礎之上,Arm推出全面設計 (Arm Total Design) ,進一步結合生態系統的力量,簡化定制芯片的開發流程,並且讓交付變得更加容易、便捷。
Arm全面設計的推出,讓ASIC 設計公司可以快速啟動設計項目,並隨時可將其設計方案提供給所需的客戶;IP 供應商可以針對Neoverse CSS,進行預先集成、預先驗證和預先優化高級IP;EDA合作夥伴可以無縫支持最先進的工具和流程,簡化SoC設計;商業固件解決方案可早於芯片流片之前便開始開發;與此同時,Neoverse CSS的設計將經過專門優化,充分發揮領先的工藝節點的優勢。
顯然,在基礎設施追求差異化的時代,Arm Neoverse CSS和Arm全面設計是當下滿足差異化需求的最佳選擇。
還要註意到,Arm已經轉型為一傢計算平臺公司,如今Arm的全面計算解決方案 (Arm Total Compute Solutions)、Arm Neoverse平臺、Arm Corstone 以及 SOAFEE 等計算平臺都已經被廣泛應用於移動、基礎設施、物聯網以及汽車等領域。