Intel首批通過AISBench大模型性能測試!5代至強可達每秒2493 token


快科技9月5日消息,近日,第五代英特爾至強處理器,以優秀的表現通過中國電子技術標準化研究院組織的人工智能服務器系統性能測試(AISBench)。

借此,英特爾也成為首批通過AISBench大語言模型(LLM)推理性能測試的企業。

在AISBench 2.0測試工具的評估下,第五代英特爾至強處理器在ChatGLM V2-6B(60億參數)和Llama2-13B(130億參數)兩個模型上均展現卓越的性能,能夠滿足輕量級大語言模型的實時推理要求。

測試結果顯示,在60億參數的ChatGLM V2模型通用推理中,當輸入輸出序列為256時,處理器可達每秒2493 token的性能;當輸入輸出序列為2048時,性能為每秒926 token。

在130億參數的Llama2模型通用推理中,當輸入輸出為256時,性能為每秒513 token;當輸入輸出序列為2048時,性能為每秒132 token。

AISBench 2.0的測試結果,驗證英特爾至強在運行輕量級大語言模型時展現出的優異推理性能。

也使得客戶可以通過基於至強的服務器,構建一個通用AI系統進行數據預處理、模型推理和部署,從而獲得兼具AI性能、效率、準確性和可擴展性的組合。

同時還彰顯英特爾至強可以為企業提供開箱即用”的功能,即可以在通用系統上部署一部分AI工作負載,從而為客戶帶來更佳的總體擁有成本(TCO)優勢。


相關推薦

2024-04-10

對MXFP4數據格式的軟件支持,能夠運行700億參數的Llama 2大模型,對比四代至強能將令牌延遲縮短最多6.5倍。Sierra Forest將在今年第二季度正式發佈,Granite Rapids緊隨其後登場。另外,Intel確認將在今年內推出代號Lunar Lake的下一代酷

2023-03-27

est,制造工藝均升級到Intel 3,接口都是LGA7529,分別采用P性能大核、E能效小核,之前傳聞是分別做到128核心、334核心,現在又流傳最高分別可達132核心、512核心,那可就大大超過AMD(當然還得看Zen5)。LGA7529新平臺的主板之前就曾

2024-03-02

,Intel首次公開代號SierraForest的下一代至強,並披露一些性能指標。SierraForest將首次采用全E核(小核心)設計,單芯片最多144個,雙芯片整合封裝最多288個(288線程),制造工藝則升級為Intel3——也就是現在酷睿Ultra使用的Intel4的升級

2022-10-13

桌面上,Intel早早就公佈MeteorLakke14代酷睿、ArrowLake15代酷睿、LunarLake16代酷睿、NovaLake17代酷睿……在服務器數據中心,Intel可擴展至強也是公開長期路線圖,包括第四代SapphireRapids(Intel7工藝)、第五代DmeraldRapids(Intel7工藝)、第六代G

2023-02-03

這兩天,我們多次見到Intel2024年下代至強LGA7529封裝接口的消息,一個龐然大物,觸點/針腳數量比現在第四代SapphireRapidsLGA4667增加多達61%,整體長度已經堪比內存條。根據最新消息,LGA7529封裝插座的尺寸為105x70.5毫米,也就是

2022-10-18

AMD多年來一直在多核上有優勢,不過12代酷睿開始,Intel通過P、E核異構實現反超,13代酷睿做到24核32線程,核心數已經超過銳龍7000的最大16核。在服務器處理器上,AMD優勢更大,64核128線程的都用兩代,Zen4這一代的Genoa做到96核19

2023-12-23

大模型標準符合性評測”結果公佈。阿裡雲通義千問成為首批通過評測的四款國產大模型之一,在通用性、智能性等維度均達到國傢相關標準要求。據悉,本次通過評測的首批大模型中,通義千問是唯一的開源模型,在全球擁有

2023-02-16

核心、指令集、Mesh網格、睿頻加速等等都有調優,可以通過Intel XTU工具輕松超頻。當然,作為工作站產品,除有良好的硬件基礎,軟件優化、認證更是重中之重。在這方面,有著強大號召力的Intel自然是極大豐富,各種圖形編輯

2024-02-05

抗衡,但也不能放棄,隻是實力所限,提升有點慢,下一代至強W-3500、至強W-2500系列已經曝光,看起來挺牙膏的。至強W-3400、至強W-2400系列是2023年2月份剛發佈的,來源於四代可擴展至強Sapphire Rapids,最多56核心112線程、105MB三級

2022-07-18

,熱設計功耗最高360W。現在,我們第一次看到新霄龍的性能!來自旗艦型號霄龍9654P,96核心192線程,三級緩存384MB,功耗360W,而頻率之前理解錯:2.0-2.15GHz隻是目前初定的基礎頻率,全核加速頻率可達3.05GHz,單核最高則可到3.5-

2022-09-29

在創新活動的第二天,英特爾放出SapphireRapids至強可擴展芯片的首份基準測試數據。可知除進一步縮小與AMDEPYC競品之間的核心數差距,藍廠還展示SapphireRapids的加速器封裝。這些固定功能的硬件組件,可為特定類型的服務器工作

2024-03-20

都會采納。亞馬遜雲、谷歌雲、微軟Azeure、甲骨文雲將是首批提供Blackwell GPU驅動實例的雲服務提供商,NVIDIA雲合作夥伴計劃的中的Applied Digital、CoreWeave、Crusoe、IBM Cloud、Lambda也將提供上述服務。Indosat Ooredoo Hutchinson、Nebius、Nexgen

2023-03-31

第四季度按期交付。它將延續現在的Intel 7制造工藝、P核性能核架構、Chiplet小芯片封裝、LGA4677接口,官方稱將擁有極高的內核性能,同等功耗范圍內實現更高的能效,並繼續內置加速器,為特定工作負載進行優化。Intel還現場展

2022-10-13

爾下一代SapphireRapids、GraniteRapids和DiamondRapids系列有關的至強CPU新爆料。若傳聞靠譜,藍廠或於2023年Q1/Q3季度、陸續推出4/8路的SapphireRapids至強CPU型號,此外還有整合HBM高帶寬緩存的Granite/DiamondRapids型號。隨著英特爾放出未來幾年