特斯拉披露自研Dojo超算項目新進展 測試性能強到一度讓電網跳閘


作為特斯拉自行定制的超算平臺,Doji旨在為該公司的人工智能(AI)/機器學習(ML)應用提供支撐。尤其是利用其自動駕駛車隊采集的視頻數據,以展開相關訓練。此前這傢電動汽車巨頭已經擁有一臺基於NVIDIAGPU的大型超算,但Dojo已用上特斯拉的自研芯片和全套基礎設施。

1.webp

Electrek 預計,這臺定制超算可提升特斯拉使用視頻數據訓練神經網絡的能力,相關計算機視覺技術可為其自動駕駛工作提供至關重要的支撐。

事實上,早在去年的 AI Day 活動期間,特斯拉就已表示在抓緊打造 Dojo 超算。在每套芯片+訓練塊的基礎上,該公司還致力於構建一套完整的 Dojo 機櫃(或 Exapod 集群)。

2.webp

時隔一年,特斯拉在周五的 AI Day 活動期間,公佈 Dojo 項目取得的最新進展。

該公司證實,其現已能夠通過一個 Dojo 塊(tile)取代六張 GPU、且更具成本優勢。

3.webp

更確切地說,該公司已成功地從一套“芯片+訓練塊”、發展到現在的“系統托盤”/ 完整機櫃。

每個托盤包含六個這樣的計算塊,且性能相當於 3~4 個滿載的超算機架。

4.webp

目前該公司正在將主機接口集成到系統托盤上,以構建一套完整的大型主機組件,以將這些系統托盤安裝到一個 Dojo 機櫃中。

不過在將幾個機櫃組合成 Dojo Exapod 所需的基礎設施之前,該公司仍需對其展開更多研發測試。

5.webp

Dojo 首席系統工程師 Bill Chang 補充道 —— 為應對前所未有的散熱和功率密度,他們必須重新審視數據中心基礎設施的各個方面,以開發定制的高性能散熱與電力系統。

尷尬的是,今年早些時候的基礎設施測試,還對當地電網的變電造成巨大的沖擊。最終在導致電網跳閘並被政府致電“問候”之前,他們已將功耗推升到超過 2 兆瓦。

7.webp

最後,特斯拉分享 Dojo Exapod 的關鍵規格數據 —— 1.1 EFLOP @ BF16 / CPP8 性能、1.3 TB SRAM、以及 13 TB 的高帶寬 DRAM 。

如果一切順利,該公司計劃在 2023 年 1 季度擁有首個完整的 Exapod 集群(目前計劃在帕羅奧托擁有 7 個),同時試圖借助該活動招募到更多人才。


相關推薦

2022-08-25

特斯拉備受關註的Dojo超算指令集結構細節史上首次大公開!而且還大秀一把Dojo的數據格式、系統網絡,以及軟件系統繞行死節點的能力。關於特斯拉自研的AI芯片D1,更多細節也被披露。原標題:特斯拉Dojo超算最新細節大公開

2023-12-08

據媒體周四(12月7日)報道,知情人士透露,特斯拉公司Dojo超級計算機的項目負責人GaneshVenkataramanan已經於11月份離職。在過去五年中,Venkataramanan一直在領導Dojo項目的推進工作,加入特斯拉前他在AMD擔任近15年的長期工程總監

2022-10-10

—— 距 1.685 ExaFlops 的預設目標想去甚遠。雖然官方尚未披露確切信息,但有傳聞稱 —— 為 HPE Cray 超算打造的 Slingshot 網絡互聯,與 HPE 集群發生沖突。此外據說 AMD Instinct MI250X GPU 加速卡,也和 EPYC Trento CPU / Slingshot 互連方案

2023-03-23

,除蘋果之外,其他向DMV註冊的企業還包括奔馳、Waymo、特斯拉、英偉達和Zoox等其他科技企業和汽車制造商。多年的傳言、專利和不太秘密的測試項目表明,蘋果汽車可能即將問世。然而,最近的傳言稱,蘋果已經不再優先考慮

2022-07-19

僅旨在成為英國防空系統的關鍵組成部分,還致力於提振自研技術和工業出口。在與其它日本和意大利等國攜手合作的同時,還能夠為英國提供國防決策的獨立性。按照計劃,驗證機需要數百傢企業的共同努力。開發地點選在英

2022-08-16

眾所周知,特斯拉內部一直在積極研發一套針對神經網絡視頻訓練而優化的新款超級計算機。目前該公司神經網絡有在處理來自超過百萬輛汽車的大量視頻數據,但研究團隊顯然並不滿足於現有的硬件選項。事實上,過去幾年裡

2022-07-16

019 年被發現,Google 基於公開 Android 代碼(AOSP)創建一個項目,能夠為 Fuchsia 設備創建 Android Runtime 版本。在 2021 年 2 月啟動的“device/google/fuchsia”,在 Android 設備中啟動 Fuchsia 項目,隻是目前並沒有公開的進度指標。而本周,

2022-08-17

,無懼上述挑戰的Tachyum,已經向美國能源部提交20ExaFlops超算系統的競標申請。如果一切順利,美國能源部最早有望於2025年部署該系統。在競標書中,Tachyum 介紹其先進的通用處理器技術,以及包括 Prodigy 和 Prodigy 2 在內的長期

2022-10-01

特斯拉的人形機器人來,成本不到2萬美元(約合人民幣14萬元),最快3年內或許就能買到。就在今天,特斯拉又一次舉辦AIDAY活動,仍然發揮延遲開始的傳統藝能。與往常馬斯克主講的模式不同,在本次AI DAY上,馬斯克穿著“撞

2023-11-22

理想可能不會采用目前應用廣泛的 GPU 架構,而是采用與特斯拉 AI 超級計算機 Dojo 或者 AI 芯片初創公司 Tenstorrent 類似的架構。上述人士表示,“謝炎是做編譯器出身,希望能夠用軟件調度實現降維打擊,提高利用率。”特斯拉

2023-11-14

NVIDIA發佈全新的H200HopperGPU,該GPU現在配備美光公司生產的世界上最快的HBM3e內存。除新的人工智能平臺,NVIDIA還宣佈其GraceHopper超級芯片在超級計算機領域取得重大勝利,該芯片現在為ExaflopJupiter超級計算機提供動力。NVIDIA的H100

2024-03-22

超級計算機,但他旗下公司與英偉達的關系卻日益緊密,特斯拉和xAI都在大規模采購英偉達的硬件產品。2023年11月,2023年11月,蘋果和迪士尼為抗議X平臺上增加的反猶和其他形式的仇恨言論,暫停廣告投放。面對是否跟進的問

2022-10-05

特斯拉為演示其Dojo超級計算機的AI系統堆棧部分,於是公佈多張由AI生成“CybertruckonMars”設計。特斯拉的AIDay並非面向普通消費者,馬斯克表示該活動充滿大量技術細節,主要針對的是人工智能和機器人專傢。演講中更有趣的部

2022-09-24

綜合多傢科技媒體報道,特斯拉公司已經向選定的客戶和支持者發送“2022年人工智能日”(AIDay2022)活動的邀請函。根據特斯拉此前公佈的官方聲明,“2022年人工智能日”定於加州時間下周五(9月30日)在帕洛阿托舉辦,屆時