Mozilla 的 Llamafile 0.8.2 通過新的 AVX2 性能優化獲得巨大成功


MozillaOcho是瀏覽器公司的創新和實驗小組,其有趣的創新之一是Llamafile,這是一種從單個文件分發和運行人工智能大型語言模型(LLM)的簡便方法。今天晚上發佈的Llamafile0.8.2是最新版本,更新Llama.cpp,最令人興奮的是對AVX2性能進行優化。

image.webp

Llamafile 的目標是讓用戶和開發人員更容易獲得人工智能 LLM,它支持從單個文件精簡部署大型語言模型,這些模型既能在 CPU 和 GPU 上執行,也能跨平臺運行。Llamafile 已經支持利用 AVX/AVX2 實現更快的性能,並支持 AVX-512 以實現更快的速度。在今天發佈的 Llamafile 0.8.2 中,又增加 AVX2 優化功能。

Llamafile 0.8.2 發佈說明中提到

"此版本為 K-quants 和 IQ4_XS 引入更快的 AVX2 提示處理。這是由 @ikawrakow 貢獻給 llamafile 的,他在去年發明K-quants:gerganov/llama.cpp@99009e7。在之前的版本中,我們推薦使用傳統的Q4_0 quant,因為它最簡單、最直觀,可以與最近的 matmul 優化一起使用。多虧 Iwan Kawrakow 的努力,現在(在現代 x86 系統上)最好的quants(如 Q5_K_M)將以最快的速度運行"。

在過去幾年中,英特爾和 AMD 處理器廣泛支持高級矢量擴展 2(Advanced Vector Extensions 2):大多數英特爾 CPU 從 Haswell 開始支持高級矢量擴展 2,而 AMD 方面則從 Excavator CPU 開始支持高級矢量擴展 2。

拉取請求指出,在更快的 AVX2 提示處理方面取得一些令人振奮的成果。據報告,各種計算器具的速度都提高 1.4 至 2.3 倍。

大量參與 Llamafile 開發工作的 Justine Tunney 最初回應拉取請求:

"這是一個不起的變化 @ikawrakow。我很高興看到最好的量化格式現在能以最快的速度運行。在 x86-64 機器上,我一直看到提示處理的速度提高 1.2-2.0 倍。你們甚至成功地使令牌生成速度更快(我發現這要困難得多),在某些情況下甚至提高 1.33 倍!"

對於 Llamafile 0.8.2 而言,這些針對提示處理的 AVX2 優化已經足夠令人興奮。不過,0.8.2 版還帶來內存錯誤修復、文本生成的輕微性能優化、本周的 Llama.cpp 代碼更新以及各種新標志。

有關 Llamafile 0.8.2 版的下載和更多詳情,請訪問GitHub。針對新版本的新Llamafile 基準測試即將發佈。


相關推薦

2024-04-03

借助Llamafile的最新更新,在本地系統上運行龐大的LLM模型變得更容易,因為采用AVX-512的AMDRyzenCPU性能提升10倍。Phoronix報道稱,Llamafile的最新更新現在支持AVX-512指令集,使支持AVX-512的CPU在使用該軟件時性能得到大幅提升。據悉,

2024-02-21

開發一種新的定制網絡卡,它可以減少英偉達網絡部門(通過收購Mellanox成立)對微軟服務器設備的控制。據報道,這種網卡與英偉達公司的ConnectX-7型號相似,最大帶寬支持400Gb以太網。不過,由於芯片尚未問世,上市時間還遙

2023-12-03

it doesn't exist:sudo install -d -m 0755 /etc/apt/keyrings# Import the Mozilla APT repository signing key:wget -q https://packages.mozilla.org/apt/repo-signing-key.gpg -O- | sudo tee /etc/apt/keyrings/packages.mozilla.org.asc > /dev/null# The fingerprint should be 35BAA0B33E9EB396F59CA838C0BA

2022-09-20

當"無聊",沒有多少明顯的變化,但MozillaFirefox105.0版本今天上午發佈,這次的變化比較大。新版為Linux用戶提供更好的性能,特別是在遭遇系統內存壓力/低內存的情況下。自Firefox 105.0 Beta發佈以來,已經有一

2023-07-23

耀Magic V2定位於吸引蘋果和直板手機用戶轉向折疊屏,並通過實現全新的產品進化獲得銷量突破。該機厚度僅9.9mm,重量輕至231克,打破行業記錄。魯班鈦金鉸鏈和SGS認證的折疊壽命超過40萬次,保證耐用性。榮耀Magic V2采用青海

2023-01-14

Rust是由軟件開發人員GraydonHoare在2006年在Mozilla研究院工作時創建的,它的知名度不斷提高,在大型科技公司中贏得新的支持者。甚至Google現在也在考慮在其Chrome瀏覽器中整合這種新的(類似)語言。Rust是由Mozilla贊助和支持的,

2022-07-19

理器的 64 位基準測試● 針對英特爾 Alder Lake-N CPU 的 AVX2 優化基準測試● 面向兆芯 ZX-C+、兆芯開顯 KX-5000、開顯 KX-6000 處理器的 AVX 加速 64 位基準測試● 英特爾 Jasper Lake 和 Lakefield 處理器的 SSE4 加速基準測試● 進一步優化的 SHA3

2022-10-11

——AMD銳龍7000系列AM5臺式處理器中集成的RDNA2核顯,可通過新BIOS輕松飆過3GHz頻率、並帶來20%的性能提升。此外林大演示PBO增強模式下的熱限制曲線,這是微星在X670/X670E主板上引入的一項新功能。作為一項特色功能,熱限制曲線

2022-07-03

是,AMD知道其絕大多數的用戶群還不會轉向AM5。因此,AMD通過Ryzen 7 5800X3D和幾個主流的Ryzen 5000選項給瞭我們一個預告,告訴我們在這個平臺上會有什麼期待。根據最新的傳言,看起來我們將在未來幾個月看到更多的AM4平臺的行

2022-07-06

成為主流之後,NVIDIA的做法並非一味暴力增強算力,而是通過有針對性地優化來以最佳的效率提升性能,其中的例子包括支持混合精度訓練和推理,對於INT8的大力支持,在GPU中加入Tensor Core來提升卷積計算能力,以及最新的在H10

2022-06-29

Mozilla已經發佈瞭其Firefox瀏覽器的v102.0最新功能更新。第102版現在可供所有用戶在穩定頻道使用,它改進瞭下載用戶界面,在畫中畫中提供瞭更好的字幕支持,還有各種修復和安全改進。Mozilla Firefox 102 有哪些新功能?厭倦瞭太

2022-07-26

的應用程序很少。於是,Netscape的開發者Jamie Zawinski註冊Mozilla,這個名字原本是Netscape的版本代號,是莫紮克(Mozake)和哥斯拉(Godzilla)的組合。Mozilla最初的目標是成為一個應用程序套裝,提供一系列互聯網導航以及通信應用

2023-02-16

蘋果公司正在繼續將其供應鏈的部分環節從中國轉移出去,最新的舉措是在越南協助建立一個巨大的富士康制造業基地。富士康宣佈投資3億美元擴大其在越南北部的生產設施,現在這傢供應商正在租賃一個位於河內以東北江省

2024-02-14

任命新的臨時首席執行官之後,Firefox瀏覽器背後的組織Mozilla正在對其產品戰略進行一些重大調整。具體來說,Mozilla計劃縮減對一些產品的投資,包括其VPN、Relay以及一周前才推出的在線足跡清除器(OnlineFootprintScrubber)。Mozilla