Intel獨立GPU雖然是後起之秀,但正無處不在!今天,Intel正式發佈全新的數據中心GPUFlex系列(曾用代號ArcticSound-M),主要用於視頻轉碼與傳輸、視覺AI推理、雲遊戲、桌面虛擬化等領域。
早在2020年11月,Intel就發佈首款面向服務器和數據中心的獨立GPU,基於Xe LP低功耗架構的DG1核心,面向的就是高密度、低時延的安卓雲遊戲、流媒體服務。
全新的Flex系列則是基於Arc A系列獨立顯卡同款的Xe HPG高性能架構、DG2核心,支持H.264、H.265(HEVC)、AV1硬件編解碼,VP4解碼與傳輸。
該系列包括兩款型號:
一是Flex 170,滿血的32個Xe核心(512個執行單元/512個XMX引擎)、32個光追核心,基準頻率1950MHz,最高加速2050MHz,搭配256-bit 16GB GDDR6顯存,等效頻率18GHz,帶寬576GB/s。
整卡功耗150W,單插槽設計,PCIe 4.0 x16系統接口。
二是Flex 140,一半的16個Xe核心(256個執行單元/256個XMX引擎)、16個光追單元,基準頻率、最高加速分別降低至1600MHz、1950MHz,搭配192-bit 12GB GDDR6顯存,等效頻率14GHz,帶寬336GB/s。
整卡功耗也減半來到75W,系統接口同樣減半至PCIe 4.0 x8。
這樣的規格,應該分別對應桌面頂級型號Arc A770、主流型號Arc A580的水平,當然它們倆是沒有視頻輸出接口的,頻率、功耗估計也會不太一樣。
Flex GPU系列集成最多四個Xe媒體引擎,相比於NVIDIA A10,可提供5倍的媒體轉碼吞吐性能、2倍的媒體解碼吞吐量,而且隻需要一半的功耗,開源的AV1硬件編碼器還能節省30%以上的帶寬。
它單卡即可支持多達36路視頻流的1080p60轉碼吞吐量、8路視頻流的4K60轉碼吞吐量。
在4U服務器中擴展到10卡配置時,可以支持多達360路視頻流的H.265-H.265 1080p60轉碼吞吐量。
搭配Deep Link超級編碼功能,Flex 140可在單卡上配備兩套編解碼設備,滿足“一秒時延”要求,同時提供8K60實時轉碼,適用於AV1、H.265 HDR格式。
安卓雲遊戲方面,Flex 170、140分別支持多達68路、46路720p30數據流,Flex 140 6卡可以做到216路720p30數據流。
目前,Google Play商店中熱門的近90款遊戲都已經得到支持。
另外,Intel還提供一整套開放式、包括開源組件和工具的軟件堆棧(Open Software Stack),以有效實現Flex GPU面向視覺雲工作負載的功能,包括對oneAPI、OpenVINO的支持。
戴爾、慧與(HPE)、新華三、浪潮、聯想、超微等將陸續推出搭載Flex GPU的系統。
應用方面,首先從媒體傳輸、安卓雲遊戲開始,隨後擴展到Windows雲遊戲、AI、VDI(虛擬桌面基礎架構)。