世界上最快的AI芯片,是何方神聖?


這兩天,IBM低調地發一個新聞,推出一款類腦芯片“北極”(NorthPole),對比4nm節點實現的NVIDIAH100GPU相比,NorthPole的能效提高五倍,成為當之無愧是現在世界最強的AI芯片。如此逆天的性能,但在國內,關於這款芯片的新聞卻寥寥無幾。那麼,它究竟是何方神聖?

把腦子裝進芯片,就行?

首先,IBM的“北極”NorthPole是一種類腦芯片,我們需要先解什麼是類腦芯片

所謂類腦芯片,顧名思義,就是一種高度模擬人腦計算原理的芯片,基於對現代神經科學的理解,反復思考如何從晶體管到架構設計,算法以及軟件來模仿人腦的運算。如果把類腦芯片做得更像人腦,就會被賦予一個新的名字——神經形態計算(Neuromorphic Computing)

人類的思考方法與現在傳統的芯片存在許多區別,比如,人沒有單獨的存儲器,沒有動態隨機存取存儲器,沒有哈希層級結構,沒有共享存儲器等等。

“存儲”和“處理器”錯綜復雜地深繞在人腦裡,在人腦的結構中有“神經元”的存在。在電腦中,以數字化核心相互交流基於事件的信息,叫做脈沖,這點和人腦傳遞信息的方式相似。

人類便從人腦中得到靈感,從而創造出這樣的芯片,來提升性能,成為真正的“人工智能”,甚至無限接近人類,獲得思考能力。

當然,人腦很復雜,而且人們所制造出來的IC器件,也存在優勢,所以人們最終目標就是把這二者的優勢融合起來。

總而言之,用人話來解釋,類腦芯片,就是結合生物大腦和人造器件各自優點而設計制造出來的一種芯片,而它也會像人一樣思考,自我學習。


想造一顆這樣的芯片,可不是光變器件結構就行的,而是從材料、器件、電路、架構帶動算法和應用改變的。一言蔽之,就是集合各種最先進的技術,才能造出這樣的芯片。

雖然實現路徑很多,但奈何這種芯片技術難度太大,且不說好不好造,設計出來就很難,所以目前也在開拓階段,都還無法達到商業化水平。

但筆者解到,之所以類腦芯片還未形成大規模商業化,一是因為設計難題依存,就拿英特爾、IBM都看好的CMOS型,多塊全數字異步設計的芯片互聯、芯片連接的有效性和時效性以及軟件層互連計算、分佈式計算和靈活分區等問題都難以解決;二是制造、軟件和生態都要完全推翻,雖然矽基晶體管路線部分可復用,但底層不可能完全照搬,這就進一步加劇大規模商業化難度。

那,我們為啥費大力氣折騰類腦芯片?

類腦芯片實在太香,筆者解到,某些情況下,完美的神經形態芯片可以用比傳統解決方案低1000倍的能耗來解決問題,這意味著我們可以在固定的功耗預算下,打包更多的芯片來解決更大規模的問題。

類腦芯片的超高能效比足夠讓我們牟足力氣研究和突破。拿一個最典型的例子來看,AlphaGo下棋打敗人類,但人類隻用20瓦的大腦能耗,而AlphaGo是2萬瓦。


神經形態芯片涉及的領域和機會,圖源丨Nature Computational Science

結構上,目前全世界的類腦芯片基本都一致,都是由神經元計算、突觸權重存儲、路由通信三部分構成,同時采用與脈沖神經網絡(SNN)模型。

但依據材料、器件、電路,分為模擬電路主導的神經形態系統(數模混合CMOS型)、全數字電路神經系統(數字CMOS型)、基於新型器件的數模混合神經形態系統(憶阻器是候選技術)三種流派。

全球范圍內,參與神經形態計算芯片開發的機構主要包括三類:英特爾、IBM、高通等為代表的科技巨頭企業,斯坦福、清華為代表的高校/研究機構以及初創企業。

根據筆者之前與英特爾研究院對話中獲悉,數字CMOS型是目前最易產業化的形式,一方面,技術和制造成熟度高,另一方面,不存在模擬電路的一些顧慮和限制

當然,需要強調的是,數字CMOS型還隻是最初階的類腦芯片,還算不上完全模擬人腦的神經形態器件,隻能算是一種借鑒神經形態理念的一種芯片。但光是借鑒人腦,這種芯片就能夠碾壓世界上任何一種芯片。IBM的NorthPole就是這樣的數字CMOS型的類腦芯片。


類腦芯片主要類型和研發進度,制表丨電子工程世界

IBM的芯片,什麼水平?

先說結論,應該是迄今為止,人類水平最高的類腦芯片,對於類腦芯片研究又上一個臺階

2008年,IBM就開始研究類腦計算,2011年有第一次突破性成果:IBM的第一代神經突觸計算機芯片。研究人員制造出兩個這樣的芯片模型:一顆包含262,144個可編程突觸,一顆則包含65,536個可學習突觸,通過測試展示其可執行導航、機器視覺、模式識別、關聯記憶和分類等簡單功能。

直到2014年,IBM在《科學》雜志發表一篇文章,向全世界展示劃時代的技術進展:一個符合DARPA SyNAPSE項目指標的、擁有100萬神經元的類腦處理器,即TureNorth,在當時掀起類腦芯片研究熱潮。

沉寂8年,“北極”(NorthPole)問世,NorthPole就是建立在IBM最後一顆類腦芯片TrueNorth基礎之上,彼時TrueNorth就有這比傳統微處理器低四個數量級的能效比,對比一下二者,就能很直觀感受到IBM技術的變化:

單個TrueNorth芯片包含4096個計算核心,可以實現神經突觸和神經元排列的動態映射。IBM TrueNorth系統的一個吸引人的功能是,單個芯片由54億個晶體管組成,僅消耗70mW的功率密度,僅占傳統計算單元的1/10000;

NorthPole采用12nm節點工藝制造,在800平方毫米內集成220億個晶體管,有256個內核,在8位精度下,每個內核每個周期可執行2048次運算;在4位和2位精度下,運算次數有可能分別增加一倍和四倍。運行基於人工智能驅動的圖像識別算法速度是目前市場上同類芯片的22倍,能效是同類芯片的25倍。在不使用最先進工藝的情況下,NorthPole芯片能耗是使用最先進技術的人工智能芯片的1/5。總體而言,NorthPole的速度大約是TrueNorth的4000倍。


圖/IBM

結構方面,NorthPole與TrueNorth一樣,由一個大型計算單元陣列(16×16)組成,每個單元都包含本地內存和代碼執行能力。

計算資源方面,NorthPole每個單元都經過優化,可執行精度較低的計算,精度從 2 bit到8 bit 不等。為保證執行單元使用,它們不能根據變量值執行條件分支,也就是說,使用者代碼不能包含if語句。這種簡單的執行方式使每個計算單元都能進行大規模並行執行。在2 bit精度下,每個單元可並行執行8000多次計算。

存儲方面,所有的內存都被封裝在一顆芯片內, 這意味著每個內核都可以輕松地訪問芯片上的內存。設備外部來看,NorthPole看起來像是一個主動存儲芯片,這有助於將NorthPole集成到系統中。

不止如此,這款NorthPole目前采用的是12nm納米節點工藝制造,目前CPU最先進的技術是3nm,而IBM還在研發2nm納米節點技術,如果用上2nm,可能IBM的類腦芯片性能還會再提升很大檔次。


圖/IBM

NorthPole的潛在應用主要包括圖像和視頻分析、語音識別以及Transformer神經網絡,這些網絡是為ChatGPT等聊天機器人提供支持的大型語言模型(LLM)。這些人工智能任務可能會用於自動駕駛汽車、機器人、數字助理和衛星觀測等領域。

某些應用程序需要的神經網絡太大,無法安裝在單個NorthPole芯片上。在這種情況下,這些網絡可以分解為更小的部分,並分佈在多個NorthPole芯片上。

而NorthPole的超高能效比,意味著它不需要笨重的液體冷卻系統來運行,風扇和散熱器就足夠,而它也可以部署在更小的空間中。

國內開始研究類腦芯片嗎?

如此強大的芯片,國內也早已有所佈局。

國內研究則包括清華大學、浙江大學、復旦大學、中科院等頂級學府和機構,同時近兩年不斷湧現初創公司,如靈汐科技、時識科技、中科神經形態等。其中以清華大學的天機芯和浙江大學的達爾文芯片最具代表性。


具體而言,國內的主要成果包括:

清華大學2015年開發的第一代天機芯采用110nm工藝,2017年,第二代天機芯開始取得先進成果,基於28nm工藝制成,由156個功能核心FCore組成,包含約4萬個神經元和1000萬個突觸。相比第一代,密度提升20%,速度提高至少10倍,帶寬提高至少100倍,此外,清華大學還自主研發軟件工具鏈,支持從深度學習框架到天機芯的自動映射和編譯。根據清華大學的計劃,下一代天機芯將是14nm或更先進的工藝,且功能會強大更多;

浙江大學聯合之江實驗室共同研制的類腦計算機,其神經元數量與小鼠大腦神經元數量規模相當。該計算機包含792顆達爾文2代芯片,支持1.2億個脈沖神經元、720億個神經突觸,而其典型運行功耗僅為350W~500W;

2020年10月,清華大學計算機系張悠慧團隊精儀系施路平團隊與合作者在《自然》(Nature)雜志發文首次提出“類腦計算完備性”以及軟硬件去耦合的類腦計算系統層次結構;

2023年9月,中國科學院計算技術研究所尤海航研究員和唐光明研究員帶領的研究團隊研制超導神經形態處理器原型芯片“蘇軾(SUSHI)”,它是一款基於超導單磁通量子(SFQ)電路的超導計算芯片;

2023年10月,由中科南京智能技術研究院自主研發是目前國內規模最大、國際一流的類腦超級計算機服務正式啟用,它已實現5億神經元2500億突觸智能規模,較現有計算系統能效提升10倍以上,核心芯片自主可控。

IBM的成果代表著,這項佈局未來的技術離我們又近一步,而目前一些初創公司逐漸形成方案,開始應用。不難預見,在近幾年,這項技術商業化將逐步展開,而彼時研究成果也將照進現實。


相關推薦

2022-09-01

風電輸出暴跌,讓電力出現暫時短缺。就連被稱作是 “ 世界頭號發達國傢 ” 的美國,也不能幸免於難。得克薩斯州去年也因為遇到極寒天氣,風電發電量驟減 30% ,德州的電網直接被幹崩潰,讓四百多萬人無電可用。“ 世界

2022-10-11

,前紐約聯儲主席和財長蓋特納認為,這位保守的教授的世界觀在2008年1月發生變化。蓋特納稱:“當時他下定決心認為風險已經太大,他不得不變的非常更加激進。而此後他一直堅持這一點。”當然,由於其大放水操作在彼時

2024-02-24

之初,梁見後就決定開展“一條龍”的服務,1995年推出世界首張可以搭載兩顆CPU的服務器主板,且不久後又研制出可搭載四顆CPU的服務器主板。相較於早期主板基本隻能搭載一顆CPU的做法,這種主板的創新,對於當時的科技界

2022-08-06

虹夫婦”名下企業介入調查。那麼這次的“彩虹夫婦”又是何方神聖?據媒體報道,“彩虹夫婦”男方名為郭斌,女方名為孫彩虹,是一對“90”後夫妻。他們從高中開始經歷8年長跑後才終於結婚生子;婚後夫妻倆又雙雙投身保

2024-03-14

sSystems推出全新的WaferScaleEngine3,並將其現有的最快AI芯片世界紀錄加倍。據介紹,在相同的功耗和相同的價格下,WSE-3的性能是之前的記錄保持者CerebrasWSE-2的兩倍。基於 5nm 的4萬億晶體管WSE-3專為訓練業界最大的 AI 模型而構建,

2022-10-01

“我們要繼續做的事情就是用一切可能的方法把CUDA塞到世界每個角落,讓人們可以用它開發應用。”而按照黃仁勛的說法,英偉達是這個世界上唯一的全棧加速計算公司:“一個加速計算公司必須是全棧的,因為加速計算需要

2024-03-19

智能工廠機器人。開始提機器人。黃仁勛表示,在我們的世界裡,類人機器人很有可能會發揮更大的作用,我們設置工作站、制造和物流的方式,並不是為人類設計的,而是為人類設計的。因此,這些人類或機器人的部署可能會

2024-04-26

2016年開始,北京車展就已經取消車模。這位紅衣車模”是何方神聖呢?原來是360周鴻禕!原來,周鴻禕今天一大早就前往車展現場,去一個又一個的展臺,包括比亞迪、理想、智界、東風等。而在東風展臺,他更是直接爬到一

2024-02-22

,沒有直接回答,隻是表示:“事實的核心是,我們認為世界將需要更多(芯片)用於人工智能計算。這將需要全球在很多方面進行投資,超出我們的想象范圍。我們現在還沒有掌握足夠的數據。”他還表示,AI計算更像是能源

2024-03-20

效,並且隨著耗電的人工智能芯片變得更加普遍,將幫助世界保持可持續發展。SK海力士實際上是AI芯片領導者英偉達的HBM3芯片的唯一供應商。雖然沒有透露新HBM3E的客戶名單,但SK海力士高管透露,新芯片將首先供貨英偉達並用

2022-09-03

故事線,也許下周二的播客節目會確認夜之城即將迎來何方神聖。至於動漫劇集,該節目由CDPR與日本動畫工作室Trigger(小魔女學園、雙斬少女)合作完成,分十集播出,9月13日登陸網飛平臺。另外,有多位收到《最後生還者》

2024-02-22

美好的未來。我們將走向一個AI創造的內容比人類更多的世界,總體來說,這將是一個有益的變化。”此外,奧特曼還重申,有必要讓政府參與建立AI監管框架,以防范AI風險。他說:“我們確實有一些事情要弄清楚,有很多新發

2022-11-08

容的需求達到前所未有的高度。這種需求迫使Netflix降低世界部分地區的流媒體質量,因為互聯網服務提供商沒有足夠的系統來滿足所有客戶的需求。機場也一直在升級系統,以幫助滿足消費者的帶寬消費。為說明事情的變化有

2023-11-11

諾斯艾利斯經濟新聞網11月6日報道,美國提議讓巴西成為世界上最重要的芯片工廠之一。報道稱,10月底,由美國國務院和官方信貸機構美國進出口銀行率領的大規模代表團登陸巴西,同行的還有谷歌、英偉達、元宇宙平臺和克