從“天價”到“骨折價”,大模型要變天


聲明:本文來自於微信公眾號光錐智能(ID:guangzhui-tech),作者:藝思,授權站長之傢轉載發佈。

十年後,國內雲廠商又打起來!

近一個月,國內雲廠商掀起新一輪的大模型降價潮。這意味著AI競爭已經不僅僅是一場軍備技術競賽這麼簡單,各頭部廠商也在考慮如何賺錢。

在這場價格戰中,包括火山引擎、阿裡,還有智譜AI、面壁智能這樣的明星創業團隊都卷進來。各傢看似是在降價,其實是想通過比低價,快速搶占市場,從而實現商業化的快速落地。

從卷大模型技術到卷價格

在眾人看來,可能頭部大廠最具降價的底氣和實力,因為大廠的業務比較多,就算AI業務虧錢,也可通過其他業務來彌齊,但有關大模型價格戰的發起人卻是明星創業團隊——智譜AI。

5月11日,智譜AI大模型開放平臺上線新的價格體系,新註冊用戶獲得額度從500萬tokens 提升至2500萬tokens,並且個人版 GLM-3Turbo模型產品的調用價格從5元/百萬tokens降低至1元 / 百萬tokens,足足降5倍。但這還不夠,GLM-3Turbo Batch 批處理 API也便宜50%,價格為1元 /200萬tokens。

4天後,火山引擎放出一記重彈,宣佈豆包Pro32k模型定價是0.8厘/千tokens,這個價格比行業降低99.3%,此外,豆包Pro128k模型定價是5厘錢/千tokens。與行業模型比,價格足足降低95.8%。

這則消息一經放出,整個AI圈都不淡定。有人稱,火山引擎將大模型帶入到“厘時代”。

我們算一筆賬,以主力模型32k窗口為例,1塊錢可以從GPT買到2400個token,如果選擇國內模型,大概能得到8000多個token。如果用開源Llama自己搭建,大概可以獲得3萬個token。但通過豆包模型,1塊錢就能獲得125萬個token。這是什麼概念?相信《三國演義》很多人都讀過,共計75萬字,換算過來,也就是1塊錢能處理3本《三國演義》的文字量。

與其他大模型比起來,火山引擎簡直是白菜價,幾乎等於不要錢。可以說,火山引擎此次降價,將大模型價格戰推向高潮。

火山引擎發佈會後的兩天,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO 湯道生在騰訊雲生成式AI產業應用峰會上介紹混元大模型的技術、性能、安全、使用門檻低等特點,雖然沒有公開介紹價格。但據騰訊雲官網顯示,混元大模型可以為首次使用者提供10萬tokens的文本生成模型免費體驗額度,有效期為1年。而在tokens資源包的價格方面,窗口尺寸為32K的hunyuan-standard模型和hunyuan-pro模型,它們的模型推理輸入價格分別為0.0069元/千tokens和0.069元/千tokens,兩者均為刊例價的6.9折。

與此前比,價格明顯降低。據騰訊雲官網一份更新於5月14日的計費信息顯示,混元大模型標準版(hunyuan-standard的前身)和高級版(hunyuan-pro的前身)此前的模型推理輸入價格分別為0.012元/千tokens和0.12元/千tokens。

雖然幾傢大廠中,阿裡雲的降價策略還不明顯,但早在今年2月29日,其就釋放出一個降價的信號,堪稱阿裡雲史上力度最大的降價,本次降價涉及100多款產品、500多個產品規格。其中,雲服務器ECS最高降36%、對象存儲OSS最高降55%、雲數據庫RDS最高降40%,而這三項都是用戶使用頻率最高的產品。

從阿裡雲的降價清單中不難看出,降價的主力是傳統雲計算產品,雖然不涉及大模型,諸如GPU的AI訓練和推理算力。但雲和大模型的發展是相輔相成的,由此可以推斷,在大模型這波價格戰中,未來阿裡雲甚至更多大模型廠商很可能會加入進來,隻不過各傢的節奏不同。

反觀過去一年OpenAI的動作,降價似乎一直是其主線任務。自去年以來,OpenAI已經進行4次降價。在剛剛結束的春季發佈會上,OpenAI宣佈其最新模型GPT-4o,不僅性能有大幅提升,價格也下調50%。

大模型價格戰的序幕已然揭開。

價格戰,意欲何為?

目前,國產大模型的價格戰正在如火如荼的進行中。

有人難免發問:大模型本就是一個高投入、低產出的行業,為什麼要打價格戰?

結論非常簡單:“加快商業化落地。”

從去年下半年開始,大模型已經開始從“卷大模型技術”向“卷大模型應用”轉變。2024年,商業化、落地應用將成為大模型公司的主旋律。

最新的《中國大模型中標項目監測報告》顯示,今年1-4月,可統計到的大模型相關中標金額已達到2023年全年披露金額的77% 左右,涉及政務、金融、運營商、能源、教科、交通等各行各業,表明企業對大模型的應用需求正快速增長。

面對商業化,為何如此急切?

原因有二。一是,大模型研發成本越來越高。眾所周知,算力一直是國產大模型發展的掣肘。一方面,目前全球的算力技術,美國占據全球近9成的算力市場份額,幾乎被其壟斷。相比之下,中國算力荒的現象越來越嚴峻。

據相關數據,中國目前的算力需求量約為每年1.5億臺的服務器,而中國的算力供給量僅為每年3000萬臺的服務器,缺口達到1.2億臺,占到全球算力缺口的80%。與之而來的是,算力租賃服務的水漲船高。其中,並濟科技、中貝通信、匯納科技等公司宣佈算力服務收費大幅上漲,導致大模型研發成本進一步提升。

在巨大的成本壓力下,大模型廠商不得不加緊尋找一條商業化之路。

二是,大模型技術已經卷的差不多,通用模型具備的是通識能力,是不能解決特定行業特定場景的實際問題的,隻有一項技術被成功大規模商用才是真正的成功,顯然,經過一年的技術比拼,已經到驗證的階段。

為加快大模型的商業化落地,國內各企業紛紛行動起來。目前大模型的商業化落地大致有兩種路徑:一是API調用,二是,私有化部署。

API調用是最常見的落地方式。智譜AI自研的第四代基座大模型 GLM-4的調用價格仍為0.1元/千 tokens,百萬tokens的價格為100元,通義千問相對低,但qwen-72b-chat的調用價格也在0.02元/千tokens,OpenAI的GPT-4Turbo 每100萬tokens輸入/輸出價格分別是10/30美元。

從短期來看,雖然成本不高,但對於需求量較大的用戶和行業來說,就顯得不是很友好。

而私有化部署就更貴。截至目前,國內沒有一傢廠商披露具體的大模型訓練成本,但從多位行業人士口中得出,大模型的研發成本遠比想象中高的多,動輒成千上百萬,甚至需要以“億”來計算。

華為大模型負責人田奇曾提到,大模型開發和訓練一次需要約1200萬美元,這表明即使技術再領先的公司,大模型的訓練也是非常昂貴的。

百川智能創始人CEO王小川也曾表示,每1億參數對應訓練成本在1.5到3萬人民幣之間。因此,一個千億級參數的模型單次訓練成本預估在三千萬至五千萬人民幣之間。Anthropic的首席執行官Dario Amodei也預測過,未來兩年內模型成本將達到100億美元。

顯然,API調用和研發的高昂價格,已經成AI商業化的枷鎖。久而久之,大模型就變成有錢人的遊戲,肯定不利於大規模商業化。

而價格戰就成最直接且最快速的落地方式。但並不是所有企業都能加入進來,因為隻有把大模型的研發成本盡可能的降低到最小,才有降價的空間和資本。

如前文所述,大模型最大的研發成本是算力,所以很多廠商往往會通過提高大模型的訓練效率、降低推理成本兩種手段來降本。

中國工程院院士鄭緯民曾做過這樣的計算,在大模型訓練的過程中,70%的開銷要花在算力上;推理過程中95%的花費也是在算力上。為何在推理上做文章,也就不言而喻。

比如微軟在Microsoft Build2020上,公開為GPT-3提供支持的AI supercomputing超級計算機,其可以讓大模型的訓練效率比其他平臺高16倍,從而降低時間成本與風險成本。

國產大模型也不例外。盤古大模型早在2.0版本中,就嘗試用稀疏+稠密架構,來降低訓練成本。文心一言推出一個月後,也通過技術手段將大模型的推理性能提升近10倍,推理成本降到原來的十分之一。

阿裡雲通義大模型則聚焦於規模定理,基於小模型數據分佈、規則和配比,研究大規模參數規模下如何提升模型能力,並通過對底層靈駿集群的優化,將模型訓練效率提升30%,訓練穩定性提升15%。

而騰訊選擇一條不同於百度和阿裡的路子,其將機器學習框架Angel、訓練以及推理框架進行迭代升級,其中,Angel可以將大模型訓練效率提升至主流開源框架的2.6倍,千億級大模型訓練可節省50%算力成本。

訓練框架方面,騰訊自研機器學習訓練框架AngelPTM,可針對預訓練、模型精調和強化學習等全流程進行加速和優化,實現以更少的資源和更快的速度訓練更大的模型;推理方面,騰訊推出大模型推理框架AngelHCF,通過擴展並行能力,實現更快的推理性能和更低成本,相較於業界主流框架,其推理速度提高1.3倍。

競速大模型商業化

雲廠商亮劍

觀察下來,阿裡、騰訊、字節的商業化路徑基本趨同,即“迭代通用模型的能力+構建完整的生態+研發創新型AI產品”,但也有不同的側重點。

持續迭代大模型能力,是大模型商業化的前提。

去年至今,國內幾傢大廠都在持續迭代大模型的能力,百度先發制人於去年3月推出文心一言,目前文心大模型已經迭代至4.0版本,同時還推出多個輕量級大語言模型。其後是阿裡,去年4月通義千問大模型問世,經過2.0、2.1現已迭代至2.5版本。

騰訊算是BAT中最晚的一傢,去年9月混元問世。隨後,騰訊並沒有像前兩者一樣,通過迭代新版本來擴大聲量,而是通過技術能力彰顯其實用性。諸如升級機器學習框架Angel、機器學習訓練框架AngelPTM以及大模型推理框架AngelHCF。另外,騰訊前段時間還開源文生圖大模型,包括後續文生視頻能力的升級,通過這一些列動作讓大模型滲透到千行百業。

而字節算是最特殊的一傢,其僅用一年的時間就將豆包模型從1.0進化到3.0,而從今年火山引擎發佈的豆包模型傢族中看,不僅包括兩款通用模型 pro、lite,還推出7款功能性模型,涵蓋角色扮演、語音識別、語音合成、聲音復刻、文生圖等方面。說明火山引擎未來將深入到不同行業不同場景。

眾所周知,調用量的大小會直接影響模型的效果,在這方面,目前文心大模型日調用量達到2億,通義大模型也已過億,字節豆包大模型的日調用量達到1200億tokens(約1800億漢字)。

強生態,是大模型商業化的加速器。

生態構建方面,幾傢大廠包括百度、阿裡、字節火山引擎等都采取一個相同的路徑——構建大模型平臺,不僅提供自傢模型服務還接入第三方開源大模型,方便客戶按需調用。諸如百度智能雲千帆大模型平臺,阿裡的百煉平臺、騰訊元器以及火山引擎的方舟平臺。

為加速大模型滲透,拓展商業化市場的空間。阿裡堅定開源,去年8月通義開源,之後沿著“全模態、全尺寸”的開源路線,阿裡雲開源8款參數規模從5億到1100億的大語言模型。其中,面向端側設備,開源如0.5B、1.8B、4B、7B、14B小尺寸模型;面對企業級用戶,開源如72B、110B的大尺寸模型。此外,通義還開源視覺、音頻、代碼、混合專傢模型。

而阿裡的開源要追溯到2022年,也就是在大模型爆火的前一年,阿裡雲就完成魔搭(ModelScope)社區的搭建,該社區推出阿裡就把其近五年研發的300多個優質模型全部開源出來。周靖人還介紹道,魔搭社區平臺仍在持續擴大建設,平臺上的高質量開源模型總數已超過4500個,開發者數量也已超過500萬。

與阿裡一樣,騰訊在大模型商業化的競逐賽中,同樣選擇開源路線。不久前,騰訊雲全面開源混元文生圖模型。騰訊混元模型應用負責人張鋒表示,“在過去非大模型時代,我們就開源很多項目,在大模型時代做出開源的決定,是最近半年騰訊與客戶接觸過程中得出的結論。”

而最早入局的百度卻一直在堅持閉源路線。百度認為,閉源大模型能實現比開源大模型性能更好、成本更低的綜合效果,從而促進AI應用生態的繁榮。

AI重構內部產品,是大廠進行大模型商業化的第一站。

目前,百度已經完成對百度文庫、百度搜索、百度地圖、如流等業務的AI重構。阿裡則對釘釘、高德地圖、閑魚、餓麼、優酷、盒馬、淘票票,天貓、淘寶等阿裡集團最核心的產品進行全面升級。

字節內部也開啟賽馬機制,抖音、剪映等50多個業務線各自為營開始AI探索,此外,字節也不改“App工廠”的本色。過去一年裡,除主打的豆包App外,基於豆包大模型,還推出互動娛樂應用“貓箱”,以及星繪、即夢等AI創作工具。

而騰訊作為大模型中最低調的一傢,卻在產品側表現的尤為不低調。秉持著產業實用的原則,自去年9月混元上線以來,騰訊就將內部產品的AI化改造作為重點工作推進,目前,混元大模型已經在超600個騰訊內部業務和場景中落地。包括企業微信、騰訊會議、騰訊文檔等“一門三傑”產品,也包括騰訊樂享、騰訊電子簽、騰訊問卷、騰訊雲AI代碼助手等協作SaaS產品。

加速行業滲透,大模型商業化的最後一公裡。

無論是通用模型還是行業模型,最終的落地其實就是要解決特定行業、特定場景下的實際難題。當然在行業的選擇上,有交叉,也有不同的方向。

基於文心大模型,百度率先重構數字政府、金融、工業、交通四大行業解決方案;依托騰訊雲TI平臺,騰訊雲打造行業大模型精選商店,覆蓋金融、文旅、政務、傳媒、教育等十個行業,可提供超50個解決方案。同時,騰訊雲還攜手17傢來自不同行業的生態夥伴,發起“騰訊雲行業大模型生態計劃”,致力於共同推進大模型在產業領域的創新和落地。

阿裡也於去年發佈8個行業大模型,覆蓋金融、醫療、法律、編程、個性化創作等領域。

而據信息顯示,目前火山引擎已經與吉利汽車、長城汽車、捷途汽車、賽力斯、智己汽車等20餘傢廠商成立汽車大模型生態聯盟。同時,還與OPPO、vivo、榮耀、小米及華碩等終端廠商共同成立智能終端大模型聯盟。由此推斷,火山引擎很可能率先這兩個行業作為抓手,待成熟後再向其他行業滲透。

結語

經過一年的時間,大模型的競爭已經從卷大模型技術本身,過渡到卷大模型商業化的階段。

如大模型研發一樣,大模型的商業化落地同樣不是一件易事,前者考驗的更多的是技術和資本,而後者在前者的基礎上,還需要根據不同行業、不同的業務場景,對大模型進行微調,從而提供一款真正能為企業所需的大模型服務。

目前,各大模型廠商紛紛亮劍,但這隻是開始,接下來很長一段時間內,各頭部將持續圍繞如何加快大模型落地做文章,競爭的同時,也會把大模型推向一個新的發展階段。


相關推薦

2023-11-10

客戶,基於這些客戶自己的私有數據,構建定制化的GPT-4模型,生成針對每個客戶業務的自定義結果。OpenAI還表示,每個客戶的定制流程需要花費幾個月的時間,起步價為200萬美元。200萬美元的價格著實令人震驚,但值得註意的

2024-03-15

啥。未見過的遊戲也會玩SIMA的整體架構是將預訓練視覺模型與自監督學習的Transformer相結合。從用戶那裡接收語言指令,並從環境中獲取圖像觀察結果,然後將它們映射為鍵盤和鼠標動作。具體架構如下圖:開發人員收集一個既

2024-03-15

啥。未見過的遊戲也會玩SIMA的整體架構是將預訓練視覺模型與自監督學習的Transformer相結合。從用戶那裡接收語言指令,並從環境中獲取圖像觀察結果,然後將它們映射為鍵盤和鼠標動作。具體架構如下圖:開發人員收集一個既

2024-03-16

啥。未見過的遊戲也會玩SIMA的整體架構是將預訓練視覺模型與自監督學習的Transformer相結合。從用戶那裡接收語言指令,並從環境中獲取圖像觀察結果,然後將它們映射為鍵盤和鼠標動作。具體架構如下圖:開發人員收集一個既

2024-03-15

啥。未見過的遊戲也會玩SIMA的整體架構是將預訓練視覺模型與自監督學習的Transformer相結合。從用戶那裡接收語言指令,並從環境中獲取圖像觀察結果,然後將它們映射為鍵盤和鼠標動作。具體架構如下圖:開發人員收集一個既

2024-08-11

快科技8月10日消息,據媒體報道,美國法官認定谷歌是一傢壟斷企業,這一決定的後果是,谷歌可能要被迫剝離安卓業務。眾所周知,谷歌要求合作夥伴在他們的設備上預裝谷歌搜索和其他谷歌服務,谷歌搜索因此和安卓手機深

2024-08-12

快科技8月12日消息,在過去的幾十年時間裡,PC處理器一直被X86指令集所統治,PC市場上常見的英特爾酷睿系列和銳龍系列均采用X86架構,幾乎可以說X86一統天下。從2024年開始,隨著AI時代的到來,PC也步入更新迭代的關鍵時刻,

2023-02-08

2月7日消息,在投資互動平臺,寧德時代就外界關心的話題做最新回應。其中,寧德時代表示,麒麟電池預計將於2023年一季度量產。至於鈉離子電池,寧德時代稱,公司正致力推進鈉離子電池在2023年實現產業化。其他方面,寧

2023-11-19

整經驗,出現這種概率事件估計極低。三、阿裡雲或面臨天價賠償和客戶持續流失但不管基於何種原因宕機,自身服務器出現問題導致客戶業務癱瘓,阿裡雲或將面臨天價賠償。目前阿裡雲服務百萬級客戶數量,需針對每個客戶

2024-05-07

可以看出蘋果的AI策略逐漸明朗化。蘋果正致力於優化AI模型,使之更加精簡和高效。通過在設備上直接處理數據並改進存儲方式,蘋果已顯著加快處理速度並提高模型效率。此外,蘋果還開發名為EELBERT的系統,該系統能顯著減

2024-05-01

foqchina),作者:凌,授權站長之傢轉載發佈。1視頻生成模型“新王登基”,Sora 何以成為全球焦點?2023年以來,多模態視頻生成技術取得顯著的進展和突破,從 Runway 到 Pika 再到年末的 VideoPoet,視頻生成模型進入到加速階段。20

2022-11-22

的尾貨產品,暗示東西質量是好的,因為品牌關系才給出骨折價,讓消費者以為撿到便宜,然而這些話術背後都是套路,來看央視揭秘。據央視新聞報道,山東菏澤警方就鎖定一傢網店,它擁有百萬粉絲,每次直播帶貨都能吸引

2024-02-16

苦等GPT5沒等到,先等到OpenAI最新的文生視頻模型Sora(名字源於日語“天空)這個效果有點逆天,技術很快不再是創造力和想象力的限制,也意味著創造力和想象力的作用會越來越重要呢。Prompt:  “Beautiful, snowy Tokyo city is bust

2022-06-23

直接影響瞭顯卡市場的生態,RTX30及RX6000系列顯卡漲到瞭天價,不過今年以來幣圈震蕩,礦卡市場也變天瞭。目前礦卡已經降溫,顯卡價格也跌回到建議價瞭,不過從全網的算力來看,用於挖礦的顯卡還是天量級別,畢竟過去的1