Intel發佈全新GPU Flex:轉碼性能5倍於NVIDIA 功耗僅一半


Intel獨立GPU雖然是後起之秀,但正無處不在!今天,Intel正式發佈全新的數據中心GPUFlex系列(曾用代號ArcticSound-M),主要用於視頻轉碼與傳輸、視覺AI推理、雲遊戲、桌面虛擬化等領域。

早在2020年11月,Intel就發佈首款面向服務器和數據中心的獨立GPU,基於Xe LP低功耗架構的DG1核心,面向的就是高密度、低時延的安卓雲遊戲、流媒體服務。

全新的Flex系列則是基於Arc A系列獨立顯卡同款的Xe HPG高性能架構、DG2核心,支持H.264、H.265(HEVC)、AV1硬件編解碼,VP4解碼與傳輸。

該系列包括兩款型號:

一是Flex 170,滿血的32個Xe核心(512個執行單元/512個XMX引擎)、32個光追核心,基準頻率1950MHz,最高加速2050MHz,搭配256-bit 16GB GDDR6顯存,等效頻率18GHz,帶寬576GB/s。

整卡功耗150W,單插槽設計,PCIe 4.0 x16系統接口。

二是Flex 140,一半的16個Xe核心(256個執行單元/256個XMX引擎)、16個光追單元,基準頻率、最高加速分別降低至1600MHz、1950MHz,搭配192-bit 12GB GDDR6顯存,等效頻率14GHz,帶寬336GB/s。

整卡功耗也減半來到75W,系統接口同樣減半至PCIe 4.0 x8。

這樣的規格,應該分別對應桌面頂級型號Arc A770、主流型號Arc A580的水平,當然它們倆是沒有視頻輸出接口的,頻率、功耗估計也會不太一樣。

Flex GPU系列集成最多四個Xe媒體引擎,相比於NVIDIA A10,可提供5倍的媒體轉碼吞吐性能、2倍的媒體解碼吞吐量,而且隻需要一半的功耗,開源的AV1硬件編碼器還能節省30%以上的帶寬。

它單卡即可支持多達36路視頻流的1080p60轉碼吞吐量、8路視頻流的4K60轉碼吞吐量。

在4U服務器中擴展到10卡配置時,可以支持多達360路視頻流的H.265-H.265 1080p60轉碼吞吐量。

搭配Deep Link超級編碼功能,Flex 140可在單卡上配備兩套編解碼設備,滿足“一秒時延”要求,同時提供8K60實時轉碼,適用於AV1、H.265 HDR格式。

安卓雲遊戲方面,Flex 170、140分別支持多達68路、46路720p30數據流,Flex 140 6卡可以做到216路720p30數據流。

目前,Google Play商店中熱門的近90款遊戲都已經得到支持。

另外,Intel還提供一整套開放式、包括開源組件和工具的軟件堆棧(Open Software Stack),以有效實現Flex GPU面向視覺雲工作負載的功能,包括對oneAPI、OpenVINO的支持。

戴爾、慧與(HPE)、新華三、浪潮、聯想、超微等將陸續推出搭載Flex GPU的系統。

應用方面,首先從媒體傳輸、安卓雲遊戲開始,隨後擴展到Windows雲遊戲、AI、VDI(虛擬桌面基礎架構)。


相關推薦

2022-09-28

英特爾剛剛介紹面向數據中心的Flex系列GPU,旨在與英偉達A10展開直接的競爭。由該公司分享的第一方基準測試成績可知,Flex系列GPU能夠在特定工作負載下——比如8-bit解碼和HEVC轉碼應用程序中——實現五倍於NVIDIAA10的性能表現

2022-08-20

構設計、性能數據。Hopper GPU采用定制版臺積電4nm工藝、全新架構,集成多達800億個晶體管、18432個CUDA核心、576個Tensor核心,支持6144-bit位寬的80GB HBM3/HBM2e高帶寬內存,並支持PCIe 5.0、第四代NVLIink,性能號稱四倍於上代A100,功耗

2023-01-04

就是命名為RTX4070Ti,也考慮過RTX4070,但為抬高身價,在發佈前強行改名為RTX408012GB。如此一來,同一個型號首次有兩種顯存版本也就罷,關鍵是核心規格而已不一樣,這個所謂的RTX 4080隻有區區192-bit顯存位寬,結果遭到一致“口

2023-04-11

Intel在去年11月份發佈代號PonteVecchio的全新GPUMax系列加速計算卡,包括三個不同型號,但是現在,Intel突然取消其中的一款。IntelGPUMax系列是Intel針對高性能計算加速設計的第一款GPU產品,基於全新的XeHPC架構,多工藝、多芯片整合

2022-07-01

能提升25%、三種核心組合更靈活】2021年3月底,Arm正式發佈瞭全新的Armv9指令集,號稱10年最重要的創新、面向未來10年移動計算的基石。Armv9重點增強矢量計算(SEV2指令集)、機器學習、數字信號處理,強化安全性,並繼續提升性

2022-09-21

9月20日深夜,萬眾期待的NVIDIARTX40系列顯卡終於來!首發宣佈的有三款,分別是RTX4090、RTX408016GB、RTX408012GB。RTX40系列基於全新設計的AdaLovelaceGPU架構,在性能、效率上都實現巨大的代際飛躍,無論是實時光線追蹤,還是AI神經網

2023-02-01

說2022年顯卡市場有什麼改變,大傢不能隻看到AMD、NVIDIA發佈新一代顯卡,更重要的一件事是Intel加入顯卡市場,推出Arc系列遊戲卡,顯卡市場格局變成三國爭霸。對Intel來說,開辟高性能獨顯領域並不是一件容易的事,盡管他們

2022-09-09

北京時間9月9日,MLCommons社區發佈最新的MLPerf2.1基準測試結果,新一輪基準測試擁有近5300個性能結果和2400個功耗測量結果,分別比上一輪提升1.37倍和1.09倍,MLPerf的適用范圍進一步擴大。阿裡巴巴、華碩、Azure、壁仞科技、戴爾

2023-01-04

今晚的CES活動上,NVIDIA也發佈多款重磅產品,除桌面版的RTX4070Ti顯卡之外,新一代RTX40移動版GPU也發佈來,首次將RTX4090級別的顯卡帶入到移動平臺,號稱筆記本性能及能效史上最大一次飛躍。GeForce RTX 40系列GPU采用NVIDIA的 Ada Lovel

2022-08-31

下個月13代酷睿處理器發佈之後,Intel明年會推出14代酷睿,代號MeteorLake,這一代在架構上會大改,首次使用多芯片整合封裝,CPU部分是Intel4工藝制造,GPU部分是臺積電5nm,還有SoC、IOE核心是臺積電6nm工藝生產。伴隨著Intel將不同

2024-03-20

14.4TFlops的網絡計算能力,比上代提升4倍。此外,NVIDIA還發佈第六代通用AI超級計算平臺“DGX B200”,包含兩顆Intel五代至強處理器、八顆B200 GPU,具備1.4TB HBM3E、64TB/s帶寬,FP4精度性能144PFlops(每秒14億億次),萬億參數模型實時推

2024-02-22

理芯片引發業內的廣泛關註。其最具特色之處在於,采用全新的TensorStreamingArchitecture(TSA)架構,以及擁有超高帶寬的SRAM,從而使得其對於大模型的推理速度提高10倍以上,甚至超越NVIDIA的GPU。推理速度比GPU快10倍,功耗僅1/10據介

2023-05-16

隨著CPU、GPU性能越來越強大,不可避免地也會出現功耗增加的情況,現在桌面版CPU功耗在100W以上,服務器級的可達300W,未來兩三年就會飆升到500W甚至600W。技嘉旗下專門從事高性能計算的子公司GigaComputing泄露一張未來的產品路

2022-08-23

NekRS性能則領先0.3-1.7倍。當然,NVIDIA新一代的H100都已經發佈……Ponte Vecchio的使命是將聯合下一代可擴展至強Sapphire Rapids,用於美國的首批三臺百億億次超算之一Aorura,但不幸的是,Sapphire Rapids一再推遲,預計明年第二季度才能