ChatGPT造孽 中國高校因它算力荒


不做大模型,就沒有算力用。這是ChatGPT點燃AI風口後,國內某top3高校AI實驗室的殘酷現狀。同一個實驗室裡,非大模型團隊6人用4塊3090卡,比起同實驗室的大模型團隊10個人用10塊A800卡,本就已經不算富裕。

現在,校企合作也更偏愛大模型。去年11月ChatGPT發佈後,與非大模型團隊合作的企業驟減,近期找上門的,也是張口就問:

“你們做大模型不?”

做,有高校和企業的通力支持;不做?那就隻能眼睜睜看著算力花落別傢。

哪怕某量化私募基金的有10000張A100卡,還對高校研究團隊開放申請,也不見得能落一張到你頭上。


“要是我們組能分到一些就好。”看到這條微博,非大模型團隊帶隊的數據科學方向博士小哥羨慕不已,因為缺算力,他都愁得快仰天長嘯:我們也值得投資啊!!!

現在,大夥爭先恐後撲向ChatGPT背後GPT-3.5般的各種大模型,算力流向亦然。

其他AI領域本就不足的算力更荒,尤其是國內學界手裡的算力分配下來,貧富差距肉眼可見。

一整個實驗室就4塊3090卡

巨大規模算力以月為單位的租用成本,對研究團隊來說不是小數目。大模型正當其道,學界研究大模型的實驗室或團隊擁有算力資源的優先分配權

就拿小哥在學校的親身體驗來說,在他們研究室,大模型小組10個人有10塊A800卡可用,而另一個研究傳統機器學習方向的實驗室,整個實驗室隻有4塊3090卡

擁抱主流趨勢是一重原因,另一重原因是實驗室需要運轉和維護的經費,獲得撥款的一種形式是申請國傢項目,但必要步驟是提供論文成果。

雙重原因下,本就不多的算力資源,不得不優先分配給大模型這樣熱門且相對容易出成果的研究。哪怕對學界來說,訓一個大模型其實練不太動——因為數據、算力和資金都有些捉襟見肘。

為獲得更多的資源,有的非大模型實驗室甚至額外專門成立研究大模型的團隊。

當然,想要獲得資金和資源,校企合作也是不可或缺的一種方式。

這種推動產研融合的重要支撐形式持續已久,2020年,KDD中校企合作論文占比超過50%,這個比例在ICCV中達到45%。

舉例來說,2021年,清華大學KEG、PACMAN(並行與分佈式計算機系統)、NLP等實驗室著手推進訓練千億參數的稠密模型,但團隊用於訓練模型的計算資源並不充足。最終,校外企業智譜AI租用近百臺A100的服務器,免費提供所需算力,這才有雙語預訓練語言大模型GLM-130B的誕生。


GLM-130B的任務表現

但在眾人爭先恐後撲向GPT-3.5般大模型的當下,非大模型團隊開始不太好談這類合作。

去年11月ChatGPT發佈後,與小哥所在團隊洽談校企合作事宜的公司數量急劇減少。在其他高校,AI領域的非大模型團隊也總是面臨企業詢問,“要不要/會不會做大模型”。

本就稀缺的算力,在學界有成為追逐熱點的砝碼的傾向,算力資源分配的馬太效應由此逐漸擴大,帶給學術研究很大困擾。

ChatGPT加劇算力分配貧富分化

算力是AI飛速發展必不可少的指標,2018年,OpenAI發佈的報告中點出一個算力趨勢

自2012年以來,AI訓練任務所運用的算力每3.43個月就會翻倍。到2018年,AI算力需求增長30萬倍。


產學研對算力需求暴增,我們能提供的算力有多少?

據中國算力集團統計,截至2022年6月底,我國數據中心機架使用總規模超過590萬標準機架,服務器規模約2000萬臺,算力總規模排名全球第2

這個排名還算不錯,但攤開來看仍舊遠遠不夠,畢竟放眼全球,沒有哪個國傢不是嗷嗷待哺,等著更多的算力資源“投喂”

再退一步講,買得起顯卡,擁有的算力上去,電費也是天文數字。

況且我國還有特殊情況——

開放原子開源基金會業務發展部部長朱其罡在本月舉辦的CCF YOCSEF上發言闡述現狀稱,超算領域的核心技術,一個是IBM LSF超算系統,一個是開源系統。目前,國內多數超算中心都基於開源系統做封裝,但這個版本調度資源的效率和能力都有很大的提升空間。

以及,因為眾所周知的原因,A100、H100這倆目前性能最強的GPU,還沒找到可規模替代的方案。


英偉達A100顯卡

綜上,算力不夠已是積弊,但ChatGPT時代,算力需求劇烈擴張,除大量訓練算力,大量推理算力也需要支撐。

所以現在的情況是,因為ChatGPT顯示出大模型的推理能力,訓練和研究大模型的算力需求增加;同時因為大模型熱度爆棚,蜂擁至大模型的算力資源也增加。

分配給大模型領域的算力資源豐富起來,其他AI領域缺衣少食的情況逐漸加劇,研發能力受到掣肘。

可以說,ChatGPT成為如今的AI屆白月光後,加劇算力分配的貧富分化

這般“富”甲一方的大模型,是不是AI研究路徑上最好的?還沒人能夠回答。

但值得引起註意和重視的是,GPT系列為首的大模型不應該吸引全部目光,整個AI領域還有各種各樣的研究方向,還有更加細分的垂直領域,以及帶來更多生產力的模型和產品。

當ChatGPT的熱度趨於平緩,學界的算力資源分配差距會縮小嗎?

所有非大模型方向的實驗室和團隊,恐怕都在期待之中。


相關推薦

2023-03-20

本友 提問:我今年剛加入學校做助理教授,研究方向與ChatGPT相關。在國外,這些研究都是由相對比較年輕的人來做的,但國內不一樣,很多資源基本都在相對高級別教授或工程師手裡,比如機器、學生,但他們對新技術的理解

2023-02-01

作為全新的人工智能(AI)語言模型,ChatGPT誕生於2022年11月30日。目前,雖然其尚處於試運行階段,但已經產生極為震撼的影響。對此,我已在本專欄發表文章《ChatGPT沖擊波已來,高等教育應做好準備》(2023年1月10日第3版),

2023-02-18

最近一段時間來,ChatGPT在全球引發競逐,國內的科技巨大也在準備自己的ChatGPT產品,中國工程院院士、阿裡雲創始人王堅日前發表自己的看法,他認為國內已經具備算力及技術基礎,關鍵在如何爆發。在南方電網總部參加第四

2023-10-31

會上,阿裡雲還宣佈一項重磅計劃:雲工開物計劃”,給中國所有大學生每人送一臺雲服務器。此外,阿裡雲還將為簽約高校提供更大規模的算力資源支持,助力中國青年學者和學子攀登科研高峰。目前,清華大學、北京大學、

2023-11-03

之所以能夠為所欲為,源於強大的科技實力。資料顯示,ChatGPT-3的訓練算力消耗極為龐大,達到3640PF-days(每秒計算一千萬億次,需要計算3640天),相當於6000枚英偉達A100芯片,若考慮互聯損失的情況,需要儲備一萬張A100作為算力

2023-03-03

3月2日,OpenAI正式開放ChatGPT的API接口,開發人員可以將ChatGPT模型集成到他們的應用程序和產品中。ChatGPTAPI調用的價格以Token(數字代幣)計算,0.002美元可以獲得1000Token,1000個Token約等750個單詞。這個價格比ChatGPT剛剛開放測試

2023-02-24

最近幾個月世界上最大的科技新聞恐怕就是ChatGPT的火爆流行。ChatGPT是美國一個初創科技公司OpenAI開發的人工智能應用程序,2022年11月面向公眾開放,到今年1月已經積累1億用戶。我也是這1億用戶中的一員。這段時間我使用ChatGPT

2023-02-23

接受澎湃新聞等媒體采訪時,再次提到大熱的聊天機器人ChatGPT,並分享他心中ChatGPT的“三重人格”。ChatGPT熱潮正席卷全球。這款由“美國AI夢工廠”OpenAI制作的AI聊天機器人軟件,隻用兩個月時間,月活躍用戶達到1億,是史上

2023-02-18

申,核心生產制造還是立足中國。對於近期被輿論熱議的ChatGPT產品,楊元慶表示,ChatGPT需要建立在很高的算力基礎之上,在這方面聯想正好擁有優勢,在全世界前500個高性能計算機中,聯想建造超過180臺,可以說我們是全球最

2023-09-12

9月11日消息,有消息稱,iPhone 15國行備貨暴降30%,這是你信嗎?有數碼博主稱得到準確消息,今年蘋果iPhone 15系列國行版相較於去年,備貨量預計下調30%左右,市場預期不明朗。對於這樣的消息,有供應鏈消息人士表示,並沒有

2023-03-30

I。即使對於國內用戶,這個名字也不陌生。Open AI 旗下的ChatGPT,正在全球刷屏,順便掀起一場新的人工智能熱潮。有人甚至斷言,新的工業革命已經到來。“革命”的說法尚有存疑,但人工智能正在成為目前為數不多能夠打破

2023-02-25

蘇河”,賦能城市未來。會上,360集團創始人周鴻禕圍繞ChatGPT發展,發表主題演講ChatGPT掀起新工業革命,人類面臨終極挑戰。周鴻禕表示,ChatGPT的並不是聊天機器人,也不是下一代搜索引擎,同樣不能簡單等同於AIGC人工智能

2023-06-18

快科技6月18日消息,ChatGPT今年以來成為最火的AI應用,也帶動各大科技公司入局搶占AI大模型技術制高點,華為表態ChatGPT為代表的新的人工智能時代已到來。在日前舉行的2023年APEC工商領導人中國論壇上,華為輪值董事長胡厚崑

2023-05-11

雖然高校對ChatGPT的禁令逐漸放松,教授們也開始用ChatGPT提升工作效率,不過用AI輔助工作還是一個不能公開的秘密。ChatGPT在教育界毀譽參半,老師認為AI讓自己留的作業變得毫無意義,而學生則認為本來那些也是毫無意義的作