谷歌公佈新一代AI超算 稱比英偉達A100更快、更節能


4月5日消息,當地時間周二,Alphabet旗下的谷歌公開一些新細節,展示用於訓練人工智能模型的超級計算機,稱其比英偉達A100芯片的系統更快、更節能。谷歌公司設計自己的定制芯片,稱為TensorProcessingUnit(TPU),並將這些芯片應用於90%以上的人工智能訓練工作。這個過程通過模型對數據進行訓練,以提高其在類似人類文本響應或生成圖像等任務中的實用性。

5f224bb7100b4_5f224bb70cd87_5f224bb70cd41_谷歌TPU-Pod集群頭圖.png

目前,谷歌TPU已經進入第四代。谷歌公司在周二發佈一篇科學論文,詳細介紹如何利用自己開發的定制光開關將4000多個芯片連接成一個超級計算機。

對於構建AI超級計算機的公司來說,改善這些連接已經成為競爭的關鍵點,因為所謂的大規模語言模型正在不斷增大,已無法在單個芯片上存儲,而這些模型正驅動著谷歌的Bard或OpenAI的ChatGPT等技術。

這類模型必須分佈在成千上萬的芯片之間,然後這些芯片要在數周或更長時間內協同工作來訓練模型。谷歌的PaLM模型,是迄今為止公開披露的最大語言模型,它通過分佈在兩臺4000芯片的超級計算機上進行50天的訓練。

谷歌表示,其超級計算機可以輕松地動態重新配置芯片之間的連接,有助於避免故障並進行性能優化。

“電路交換使得我們能夠輕松避開故障組件,”谷歌高級研究員Norm Jouppi和谷歌傑出工程師David Patterson在一篇關於該系統的博客文章中寫道。“這種靈活性甚至使我們能夠改變超級計算機互聯網絡的拓撲結構,以加速ML(機器學習)模型的性能。”

雖然谷歌直到現在才公開其超級計算機的詳細信息,但它自2020年以來就已經在俄克拉荷馬州梅斯縣的數據中心內運行。谷歌表示,初創公司Midjourney使用該系統來訓練其模型,該模型在輸入幾個詞的文本後可以生成新的圖像。

谷歌在論文中表示,與相同規模的系統相比,它的超級計算機比基於英偉達A100芯片的系統更快1.7倍,更節能1.9倍。據解,A100芯片早於第四代TPU面市。

谷歌表示,它沒有將第四代TPU與英偉達當前旗艦H100芯片進行比較,因為H100是在谷歌這款芯片應用後上市的,並且采用更新的技術。

谷歌暗示正在研發一款新的TPU,將與英偉達H100競爭,但沒有提供詳細信息。Jouppi告訴媒體,谷歌有“充足的未來芯片儲備”。


相關推薦

2023-04-05

谷歌研究人員當地時間4月4日在線發表一篇論文,首次公佈用於訓練人工智能模型的超級計算機的技術細節,並宣稱該系統比英偉達的超算系統更快且功耗更低。谷歌新發表的這篇題為《TPUv4:用於機器學習的光學可重構超級計

2023-11-14

那麼英偉達又成功制造“鉑金”和“鉆石”。H200加持,新一代AI超算中心大批來襲雲服務方面,除英偉達自己投資的CoreWeave、Lambda和Vultr之外,亞馬遜雲科技、Google雲、微軟Azure和甲骨文雲基礎設施,都將成為首批部署基於H200實

2023-08-29

財大氣粗的采購者是目前行業領先的AI公司,包括OpenAI、谷歌、Anthropic、Inflection、埃隆馬斯克(Elon Musk)旗下X、臉書母公司Meta。“他們擁有的計算資源與研究人員比例最高。”SemiAnalysis寫道。SemiAnalysis指出,2024年底前,上述AI

2024-02-10

TFLOPS。它的熱設計功耗(TDP)為25W。2022年1月,Meta還推出超算RSC AI,並表示要為元宇宙鋪路。RSC包含2000個英偉達DGX A100系統,16000個英偉達A100 GPU。這款超算與Penguin Computing、英偉達和Pure Storage合作組裝,目前已完成第二階段的建

2023-08-10

黃的經典名言:“買得越多,省得越多!”英偉達最強AI超算再升級在5年前的SIGGRAPH上,英偉達通過將人工智能和實時光線追蹤技術引入GPU,重新定義計算機圖形學。老黃表示:“當我們通過AI重新定義計算機圖形學時,我們也

2023-11-10

產品針對的是訓練、推理和邊緣場景,最快將於11月16日公佈,產品送樣時間在今年11月至12月,量產時間為今年12月至明年1月。鈦媒體App從多位英偉達產業鏈公司解到,上述消息屬實。英偉達的這三款 AI 芯片並非“改良版”,而

2023-08-10

達在AI硬件這方面,已經無人能及。新芯片組成的“最強超算”來襲這場發佈會中最先拋出,也是最引人矚目的,非“最強超算”莫屬。這臺超級計算機由256塊DGX GH200 Grace Hopper(簡稱DGX GH200)連接而成。用老黃的話,這個“龐然大

2024-06-04

示,MI300系列一直以來都是AMD迅速發展的明星產品,而全新一代的MI325X更是繼承這一優良傳統。這款芯片不僅搭載先進的HBM3E高帶寬存儲技術,還采用全新的CDNA3架構,確保其在性能上的卓越表現。在性能方面,MI325X堪稱行業翹楚

2022-07-04

北京時間6月30日,MLCommons社區發佈瞭最新的MLPerf2.0基準測評結果。在新一輪的測試中,MLPerf新添加瞭一個對象檢測基準,用於在更大的OpenImages數據集上訓練新的RetinaNet,MLperf表示,這個新的對象檢測基準能夠更準確反映適用於

2023-12-07

降低開發人工智能模型的成本,對英偉達形成競爭壓力。比英偉達的GPU快多少?AMD表示,MI300X基於全新架構,性能有著顯著的提升。它的最大特點是擁有192GB的尖端高性能內存,即HBM3,這種內存傳輸數據的速度更快,可以容納更

2024-03-27

巨大潛力驅使業界人士勇敢嘗試。在這一背景下,兩位前谷歌工程師共同創立MatX。他們利用在谷歌的經驗,識別出現有人工智能芯片的局限性,並致力於開發更高效、成本更低的新型芯片,旨在提高大語言模型的訓練和運行效

2024-03-22

用英偉達技術加速Grok的訓練和提升推理能力。在英偉達新一代人工智能芯片Blackwell的發佈活動上,馬斯克公開表達對英偉達技術的高度贊賞。他稱:“在當前市場上,沒有任何人工智能硬件能與英偉達的產品相媲美。”馬斯克

2023-04-04

這次 OpenAI 之行,老黃不為別的,就是為把這臺剛出爐的超算送給 OpenAI ,給他們的人工智能項目研究加一波速。這臺DGX-1價值超過百萬,是英偉達超過3000名員工,花費三年時間打造。這臺 DGX-1 ,能把 OpenAI 一年的訓練時間,壓

2024-03-18

的合作夥伴超微電腦的股價在過去12個月內飆漲逾12倍,比英偉達的表現更加亮眼。此前,超微電腦公司隻是一個默默無聞的服務器制造商,但如今已成為企業和政府機構追逐AI浪潮時的首選合作夥伴。不僅如此,該公司還將被正