770億晶體管的中國第一算力通用GPU芯片壁仞科技BR100亮相海外

2022-08-24 來自快科技發表於業界精選

8月9日，國內科技創新企業壁仞科技(Birentech)正式發佈BR100系列通用計算GPU，號稱算力國內第一，多向指標媲美甚至超越國際旗艦產品。當地時間8月22日，第34屆HotChips芯片大會首日演講，NVIDIAHopper、AMDInstinctMI200、IntelPonteVecchio三大巨頭的通用GPU紛紛秀出肌肉，而與之並肩亮相的，就是壁仞科技BR100。

會上，壁仞科技聯合創始人、CTO洪洲與壁仞科技聯合創始人、總裁徐凌傑進行題為“Biren BR100 GPGPU: Accelerating Datacenter Scale AI Computing”的主題演講，為來自全球的專業聽眾介紹BR100芯片的特點與原創芯片架構的細節。

根據介紹，作為主要用於加速數據中心規模通用計算的GPGPU芯片，BR100具有極高的算力密度，單卡16位浮點算力達到PFLOPS級別，並具備高速片上與片外互連帶寬。

BR100采用7nm制程工藝、Chiplet小芯片設計和CoWoS 2.5D封裝技術，以OAM模組形態部署，能夠在通用UBB主板上形成8卡點對點全互連拓撲。

為支持強大的算力，BR100配備超過300MB的片上高速緩存，用於數據的暫存和重用，以及64GB的HBM2E高速內存。

它的核心計算單元由大量通用流式處理器組成，具備通用計算和2.5D GEMM架構的專用張量加速算力。

在原創架構層面，壁仞科技按照深度學習等通用負載的計算特點，提供一系列針對數據流的增強特性，包括特殊的C-Warp協同並發模式、張量數據存取加速器TDA、NUMA/UMA訪存模式、近存儲計算等。這些特性是BR100能夠在算力和能效比上達到全球領先水準的關鍵。

此外，壁仞科技還介紹一種新的TF32+數據類型，具備比TF32數據類型更高的精度。

在軟件方面，壁仞科技還介紹BIRENSUPATM軟件棧，其核心編程模型具有C/C++編程接口和運行時API，風格與主流的GPGPU開發語言和編程范式類似。

它能夠使開發者在BR100上非常容易地進行編程開發，同時大幅降低代碼遷移工作量，實現從主流編程環境向BIRENSUPA平臺的無縫遷移。

資料顯示，壁仞科技BR100集成多達770億晶體管，規模上堪比人類大腦神經細胞，已經非常接近800億個晶體管的NVIDIA GH100計算核心，而且BR100系列芯片一次就點亮成功！

性能方面，INT8整數計算2048 Tops(每秒2048萬億次)、BF16浮點計算1024 TFlops(每秒1024萬億次)、TF32+浮點計算512 TFlops(每秒512萬億次)、FP32雙精度浮點256 TFlops(每秒256萬億次)。

此外，它的外部IO帶寬達2.3TB/s，支持64路編碼、512路解碼，還支持PCIe 5.0、CXL互連協議。

770億晶體管的中國第一算力通用GPU芯片壁仞科技BR100亮相海外

相關推薦

國內第一算力通用GPU芯片集成770億晶體管一次點亮成功

壁仞正式發佈BR100芯片：國內算力最大通用GPU

IBM造一顆5nm AI處理器包含230億各晶體管

GPU國產替代逆流而上盤點九個值得關註的產品

傳中國GPU廠商壁仞科技再獲20億元投資

AMD正研發千億晶體管芯片 AI是未來10年最重要的事

專傢認為半導體行業將在本十年末實現1萬億晶體管芯片的目標

NVIDIA H100加速卡實測數據公佈：相比上代性能提升1.5倍到4.5倍

世界第一AI芯片“WSE-3”升級4萬億晶體管、90萬核心

一萬億晶體管GPU將到來臺積電董事長撰文解讀

GTC 2024硬件一覽：史上最強AI芯片GB200發佈高達2080億晶體管

最強AI芯片WSE-3發佈：4萬億個晶體管，90萬核，125 PetaFLOPS算力

Intel預告萬億晶體管芯片時代：FinFET將被淘汰

AMD預告MI300加速顯卡：1460億晶體管怪獸集成24核Zen4 CPU

770億晶體管的中國第一算力通用GPU芯片 壁仞科技BR100亮相海外

相關推薦

770億晶體管的中國第一算力通用GPU芯片壁仞科技BR100亮相海外