AMD顯卡可以原生跑NVIDIA CUDA應用 速度還挺快


NVIDIACUDA通過多年耕耘,鑄就牢不可破的生態壁壘,外人各種嘗試都無法進入,包括AMDROCm開發平臺,但其實也不是沒有辦法。開發者AndrzejJanik就憑借一己之力,借助InteloneAPI,開發CUDA兼容方案“ZLUDA”,能夠在Intel硬件上原生運行CUDA應用,後來就被停。

之後在AMD的支持下,ZLUDA重啟該項目,能夠讓AMD顯卡原生運行CUDA應用,不需要任何轉移,也不需要調整代碼。

唯一要做的,就是用ZLUDA庫替代CUDA。

雖然它不能保證每一款CUDA應用都跑起來,但已經是以一個巨大的突破。

非常可惜,AMD支持這一項目做兩年,也給停——不知道是不是受到NVIDIA的壓力。

幸運的是,ZLUDA項目並未徹底消散,已經免費開源,感興趣有能力的開發者都可以使用,而且確認可以在AMD ROCm平臺上無縫運行CUDA應用。

比如說,可以將CUDA作為Blender 4.0或者V-Ray的渲染API,尤其是Blender本來就有Radeon HIP計算渲染器,如今跑在ZLUDA上速度還會更快。

Andrzej Janik也在繼續研究ZLUDA,其中一個目標就是要讓AMD顯卡運行NVIDIA DLSS。

內部測試表明,對比OpenCL方案,其性能大部分時候都更好,最多可以領先超過75%,但因為還在開發之中,部分時候效率反而更低。


相關推薦

2023-04-04

4 倍,英特爾的 6 倍。瞧瞧,這還是當年那個求著各位買顯卡的老黃嘛?而讓英偉達的股價瘋漲的,那便是他們從十多年前就開始押註的 AI 計算。給大傢一個數據,從 15 年後,英偉達的 GPU 在超算中心的市場份額就一路上漲,

2022-11-08

NVIDIAGeForceRTX4080在下周推出,但該顯卡似乎已經已經在Geekbench5的CUDA、OpenCL和Vulkan測試中進行基準測試。測試是在AMDRyzen97950X測試平臺進行,采用華碩的ROGCrosshairX670EExtreme主板和32GBDDR5內存。在性能方面,NVIDIA GeForce RTX 4080顯卡在CU

2023-05-11

一款GPU核心用於多款顯卡,一款顯卡使用多款GPU核心。這對於NVIDIA顯卡都是常規操作,RTX40系列也終於要開始混用。發佈還不到一個月的RTX4070,除已有的AD104核心,還將會增加一個AD103核心版本。RTX 40系列現有產品線中,RTX 4090使

2024-03-06

化的並行計算應用。摩爾線程強調,將充分發揮從芯片到顯卡到集群的智算產品優勢,繼續打磨MUSA,持續為大模型訓練與推理提供高性能算力支撐。

2022-09-25

在這一代RTX40系顯卡上,DLSS3.0的重要性被反復提及。包括NVIDIA口中所謂RTX40902~4倍的性能提升,其實都是在開啟DLSS3.0和高級別光追的遊戲中才得以實現。因為DLSS依賴深度學習技術,不是100%原生畫面和分辨率,一定程度上利用“

2024-03-08

CPU和其他專用處理器幾乎處理所有計算任務。那個時代的顯卡有助於加快Windows和應用程序中2D形狀的繪制速度,但沒有其他用途。快進到今天,GPU已經成為業界最具主導地位的芯片之一。但具有諷刺意味的是,圖形芯片的唯一功

2023-06-15

在遊戲卡及加速卡市場所向披靡,現在AMD終於能有高性能顯卡與之競爭,這就是昨天凌晨發佈的Instinct MI300系列。其中Instinct MI300A就是去年宣佈的MI300,有1460億晶體管,而Instinct MI300X是新出的,擁有1530億晶體管。二者的區別在於

2024-02-21

使程序開發變得更加困難。同時,很多開源軟件開發框架可以比CUDA更高效地使用。“基本上沒有人編寫 CUDA,”Jim Keller在後續帖子中寫道。“如果你確實編寫 CUDA,它可能不會很快。[...] Triton、Tensor RT、Neon 和 Mojo 的存在是有充

2024-02-21

宣佈,全新的ROCm6.0開發平臺正式推出,繼續支持新的GPU顯卡產品、AI開發框架,從軟硬兩個層面擴展基於客戶端的AI人工智能、ML機器學習開發。此前發佈的ROCm5.7加入對RX7900XT、RX7900XTX、RadeonProW7900顯卡的支持,包括PyTorch框架也

2022-10-01

英偉達GeForceRTX4090顯卡的第一個非官方基準測試在其發佈之前已經在Geekbench5數據庫中被泄露。雖然NVIDIA一直在向玩傢提供DLSS3和光線追蹤的性能數據,但關於其下一代部件的性能表現信息卻很少。現在,我們在Geekbench5CUDA數據庫

2022-10-02

近日,NVIDIA最新的RTX4090顯卡已經正式出現在跑分平臺Geekbench,其CUDA跑分毫不意外的超越此前的“天花板”RTX3090Ti。根據目前放出的信息,在GeekbenchCUDA跑分測試項目中,RTX4090的得分為417713分,相比之下,RTX3090Ti的分數為260346分

2022-11-04

AMD宣佈其下一代顯卡,即RX7900XTX和RX7900XT,這是基於其新架構RDNA3的第一批顯卡。這兩款卡將於12月13日推出,AMD的參考卡和板卡合作夥伴型號都將在該日發貨。7900XTX的價格為999美元,而XT則便宜100美元,為899美元。這意味著與上

2022-09-02

佈會也即將來臨。今天,我們瞥見又一張GeForce RTX 40系列顯卡的圖像,這賬據稱是RTX 4080創始人版的照片的泄露者堅持認為這張照片是真正的GPU影像,而不是後期制作的圖片。雖然我們不是100%確定,因為字體看起來有點奇怪。不

2022-08-28

,再縮放提升分辨率,輸出畫面。它不但支持Intel Arc系列顯卡,也可用於任何支持Sahder Model 6.4的顯卡,最早可以到NVIDIA Maxwell、GTX 750/900系列。XeSS有四種不同模式,分別是超高質量、質量、平衡、性能,畫質依次降低,幀率依次