英特爾ARM英偉達力推規范草案,想統一AI數據交換格式


當地時間周三,芯片公司英特爾、ARM和英偉達共同發佈一項所謂人工智能通用交換格式的規范草案,目的是使機器處理人工智能的過程速度更快、更高效。英特爾、ARM和英偉達在草案中推薦人工智能系統使用8位的FP8浮點處理格式。他們表示,FP8浮點處理格式有可能優化硬件內存使用率,從而加速人工智能的發展。這種格式同時適用於人工智能訓練和推理,有助於開發速度更快、更高效的人工智能系統。

圖 1 - 語言模型 AI 訓練(來自:NVIDIA)

在開發人工智能系統時,數據科學傢面臨的關鍵問題不僅是收集大量數據來訓練系統。此外還需要選擇一種格式來表達系統權重,權重是人工智能從訓練數據中學習到影響系統預測效果的重要因素。權重使得GPT-3這樣的人工智能系統能夠從一個長句子提示自動生成整個段落,還能讓DALL-E 2人工智能基於某個特定標題生成逼真的肖像畫。

人工智能系統權重常用的格式有半精度浮點數FP16和單精度浮點數FP32,前者使用16位數據表示系統權重,後者則使用32位。半精度浮點數以及更低精度浮點數能減少訓練和運行人工智能系統所需的內存空間,同時還加快計算速度,甚至減少占用的帶寬資源和耗電量。但因為位數較單精度浮點數更少,準確性會有所降低。

然而,包括英特爾、ARM和英偉達在內的許多行內公司都將8位的FP8浮點處理格式作為最佳選擇。英偉達產品營銷總監薩沙·納拉西姆漢(Shar Narasimhan)在一篇博客文章中指出,FP8浮點處理格式在計算機視覺和圖像生成系統等用例中的精度與半精度浮點數相當,同時有“明顯”加速。

圖 2 - 語言模型 AI 推理

英偉達、ARM和英特爾表示,他們將讓FP8浮點處理格式成為一種開放標準,其他公司無需許可證即可使用。三傢公司在一份白皮書對FP8進行詳細描述。納拉西姆漢表示,這些規范都將提交給技術標準化組織IEEE,看FP8格式能否成為人工智能行業的通用標準。

納拉西姆漢說:“我們相信,一個通用的交換格式將帶來硬件和軟件平臺的快速進步,提高互操作性,從而推進人工智能計算的進步。”

當然,三傢公司之所以不遺餘力推動FP8格式成為通用交換格式也是出於自身研究的考慮。英偉達的GH100 Hopper架構已經實現對FP8格式的支持,英特爾的Gaudi2人工智能訓練芯片組也支持FP8格式。

但通用的FP8格式也會使SambaNova、AMD、Groq、IBM、Graphcore和Cerebras等競爭對手受益,這些公司都曾在開發人工智能系統時試驗或采用FP8格式。人工智能系統開發商Graphcore聯合創始人兼首席技術官西蒙·諾爾斯(Simon Knowles)在今年7月份的一篇博客文章中寫道,“8位浮點數的出現在處理性能和效率方面為人工智能計算帶來巨大優勢”。諾爾斯還稱,這是行業確定“單一開放標準”的“一個機會”,比采取多種格式相互競爭要好得多。


相關推薦

2024-03-26

英偉達主導人工智能市場的軟件優勢。據路透社報道,由英特爾、Google、Arm、高通、三星和其他科技公司組成的一個小組正在開發一套開源軟件,防止人工智能開發人員被鎖定在英偉達的專有技術上,使他們的代碼可以在任何機

2024-03-28

為 CUDA 的護城河既淺又窄。”在去年年底的一場活動上,英特爾 CEO 帕特·基辛格(Pat Gelsinger)語出驚人地指出對於英偉達 CUDA 平臺的看法。但即便基辛格認為 CUDA 的護城河“既窄又淺”,他也明白挑戰在人工智能訓練上挑戰英

2022-07-20

流行起來的DPU和AI芯片等都稱為大芯片。大傢耳熟能詳的英特爾、英偉達、AMD、高通、聯發科和Marvell等全球領先芯片公司都是典型的大芯片龍頭。2021年一季度的全球TOP 10芯片設計公司(source:集邦咨詢)在芯片產業過去幾十年

2022-08-03

從而加強整個生態系統。隨著 OpenCAPI 兼並到 CXL,這使得英特爾支持的標準成為主導的互連標準——以及行業未來的事實標準。競爭的Gen-Z 標準在今年早些時候同樣被 CXL 吸收,而 CCIX 標準已被拋在後面,其主要支持者近年來加

2023-11-15

芯片,但也在不斷轉向英偉達。但現在,英偉達正面臨著英特爾和AMD的競爭,這兩傢公司也在積極開拓這一細分市場。此外,還有眾多獲得大量風險投資的人工智能芯片初創公司選擇不與英偉達競爭,另辟蹊徑,走一些差異化路

2024-08-12

間裡,PC處理器一直被X86指令集所統治,PC市場上常見的英特爾酷睿系列和銳龍系列均采用X86架構,幾乎可以說X86一統天下。從2024年開始,隨著AI時代的到來,PC也步入更新迭代的關鍵時刻,高通發佈面向PC平臺的驍龍X Elite處理器

2022-09-28

英特爾剛剛介紹面向數據中心的Flex系列GPU,旨在與英偉達A10展開直接的競爭。由該公司分享的第一方基準測試成績可知,Flex系列GPU能夠在特定工作負載下——比如8-bit解碼和HEVC轉碼應用程序中——實現五倍於NVIDIAA10的性能表現

2023-08-09

的估值將超過600億美元,目前蘋果、三星電子、英偉達、英特爾、谷歌等巨頭們都已經行動,對其進行投資,這也引發外界質疑,除這些巨頭們,其餘廠商還能輕易獲得架構授權嗎?ARM總部位於英國劍橋,北美總部位於美國聖何

2023-11-01

領域,沒有創新,那就意味著慢性死亡。而對於英偉達、英特爾和AMD這樣的業界翹楚,更是在不斷探索前行的路上。近日,路透社援引未透露姓名的消息來源報道稱,英偉達已悄然開始設計基於 Arm 架構的 CPU,專門用於運行 Windo

2023-04-04

整個英偉達市值已經漲回到 6500 億美元,是 AMD 的 4 倍,英特爾的 6 倍。瞧瞧,這還是當年那個求著各位買顯卡的老黃嘛?而讓英偉達的股價瘋漲的,那便是他們從十多年前就開始押註的 AI 計算。給大傢一個數據,從 15 年後,

2023-07-16

創始人 /CTO、IEEE 國際頂會 HPCA 名人堂成員蔣曉維博士,英特爾院士、大數據技術全球 CTO 戴金權,以期探索 AI 大模型時代下的算力困局破解路徑,尋求算力優化最優解。1AI 大模型時代,算力需求大爆發作為 AI 的重要子領域,機

2023-11-01

英特爾公司在人工智能領域取得一項勝利,韓國第一傢在線門戶網站Naver的部分人工智能工作負載從英偉達公司(NVIDIA)提供的圖形處理器轉向英特爾公司的中央處理器。Naver以前是英偉達公司的客戶,但由於供應鏈問題和高昂

2022-08-25

CPU設計。作為一種經典意義上的中央處理器,其旨在取代英特爾至強(Xeon)/AMD霄龍(EPYC)競品,以在預先構建的高性能計算(HPC)服務器中扮演串行處理的角色——因為每臺服務器的六張GPU加速卡需要通過CPU進行互連。(via WC

2022-07-02

DIGITIMESResearch的最新數據顯示,預計AMD驅動的服務器出貨量份額將在2023年和2024年持續上升,而Arm驅動的服務在2024年達到2020年的三倍。據DIGITIMES報道,由於AMD平臺成功滲透到雲數據中心行業和HPC服務器市場,2024年AMD驅動的服務