突遭下架,“國服最強”開源模型將何去何從?


聲明:本文來自微信公眾號“科技新知”(ID:kejixinzhi),作者:餘寐,編輯:蕨影,授權站長之傢轉載發佈。

2024年下半年,國產AI大模型並不好過。

近期,AI代碼類應用cursor發佈,因其強大的編程功能,一時風頭無兩;緊接著openAI又於9月12日發佈最新模型chatGPT o1,在邏輯推理和編程能力上又提升到一個全新級別,可以說擁有真正的通用推理能力,國際AI領域的競爭日益激烈。

同樣在9月,號稱“國服最強”的開源大模型通義千問QwenLM全系列代碼在github(全球最大的開源代碼托管平臺之一)被下架,包括開源新王Qwen2.0在內的項目在訪問時全部404。不僅引發從業者對開源模型穩定性的信任危機,也暴露出國產大模型在商業化道路上的困境。

Part.1

下架風波,回應敷衍

“團隊沒有跑路,就是github org被無端端flag,所以你們看不到內容,我們已經在聯系官方目前也不知道原因。”

阿裡高級算法專傢,通義千問團隊負責人林俊暘在事件發生後迅速在社交平臺辟謠。

但這樣的回應並沒有讓AI相關從業者們滿意。在此之前,他們中的一些人剛經歷過Runway從HuggingFace上刪庫跑路的風波。Runway以Stable Diffusion系列聞名,一夜之間把自傢開源模型清空,讓無數正在使用該模型的開發者陷入停擺。

雖然目前github上QwenLM模型代碼已經恢復,但對於事件的原因,通義千問團隊並沒有再做出任何回應。對於開源模型的項目,是否會再次受制於類似事故,從業者們更加茫然和悲觀。

開源是阿裡通義大模型的重要戰略。

阿裡雲CTO周靖人曾在公開論壇表示:“開發者的反饋和開源社區的生態支持,是通義大模型技術進步的重要助力。”

大模型的訓練和迭代成本極高,絕大多數的AI開發者和中小型企業無法負擔。從這角度上來看,通義大模型的「全模態、全尺寸」開源戰略,長期沉淀的良好口碑為其贏得一眾鐵粉。

每有開源動作都會被熱切的開發者們早早蹲守。截止2023年10月,阿裡雲旗下開源社區“魔塔”已有超過2300個模型,開發者超過280萬,模型下載數破億。阿裡最新推出的開源模型QWen2系列更是風靡全球,其中Qwen2-72B更是在發佈後短短兩個小時,就沖上Huggingface開源大模型排行榜之首,隨後又衛冕全球最權威的開源模型測試榜單之首。而阿裡最新季度業績披露,通義千問開源模型下載量已突破2000萬。

通義大模型的開源之舉,打破海外閉源大模型對國內開發者們的制約。就像阿裡雲CTO周靖人所說,“阿裡雲的初衷不是把模型攥在自己手上去商業化,而是幫助開發者,開源的策略與阿裡雲的初心完全一致。”在他看來,要在AI創新技術與模型層出不窮的當下,開源是“最佳也是唯一的途徑”。

Part.2

開源VS閉源,誰是贏傢?

在大模型時代開啟之時,開源和閉源就一直爭論不休。

百度創始人李彥宏就曾在今年4月舉行的百度AI開發者大會上宣稱“開源模型會越來越落後。”隨後,李彥宏在內部講話中也對開源模型的局限性表達明確的看法——雖然開源模型獲取和使用便利,但商業化應用中卻往往遭遇GPU使用率低、推理成本高等問題。而互聯網圈另外一位大佬周鴻禕則表示:“我一直相信開源的力量。”

拋開行業大佬之間的口水戰,開源和閉源,兩種截然不同的開發方式在當今的大模型發展中各有千秋。

從陣營上看,開源模型如meta的Llama系列、斯坦福的Alpaca、國內的阿裡通義大模型等展現社區驅動的快速進步和創新。而以OpenAI的GPT系列、Anthropic 的Claude大模型、百度的文心大模型、華為的盤古大模型等都選擇閉源的形式,保持著技術領先和商業應用的優勢。

開源模式促進大模型技術的共享與創新,而閉源模式則保障商業利益和技術優勢,為大模型的商業化提供支持。

有從業者聲音認為,從模型側來講,開源模型當前還是稍遜於閉源模型。但隨著更多開源模型的迭代,開源的能力也在快速跟上。比如通義大模型Qwen2.5模型性能已經全面趕超GPT-4Turbo。

“從模型質量上來看,開源模型由於其代碼的公開性,更容易在社區得到測試和改進;但閉源模型在研發時,模型的數據語料質量、豐富程度以及算力規模,團隊的算法能力和背後強大的資金支持等因素,保證閉源模型的高質量輸出。”

上述從業者也提到,數據安全對於大模型來說非常重要,訓練時會牽涉到用戶的隱私數據,抓取也可能存在攻擊性數據。開源模型因為要開放給更多用戶,在安全和隱私方面會更加重視,安全專傢可以進行代碼審查,及時發現並修復潛在的安全風險;而閉源模型因為其代碼不公開,有專業的安全團隊進行安全防護和漏洞修復,可以減少由於外部攻擊導致的安全隱患。在業內人士看來,開源和閉源並非二元對立的關系。

Part.3

通義千問,路在何方?

比起開源和閉源之爭,如何實現商業化才是各傢大模型當前急需解決的難題。

縱觀阿裡通義大模型的體系,可以分為大模型底座和應用端產品模型兩個層面。2022年9月,達摩院發佈“通義”大模型系列,打造業界首個AI底座。經過一年多的技術爆發,通義大模型已經從初代升級至2.5版本。為滿足不同計算資源需求和應用場景,通義團隊還推出參數規模從5億到1100億的八款大語言模型,以及包含多個面向不同應用場景的模型,如Qwen-VL(視覺理解大模型)、Qwen-Audio(音頻理解大模型)等。

除底層大模型的研發,通義團隊在應用端產品也卯足勁。在去年10月的阿裡雲雲棲大會上,CTO周靖人一口氣發佈八款產品模型:包括通義靈碼(智能編碼助手)、通義智文(AI閱讀助手)、通義聽悟(AI工作學習助手)、通義星塵(個性化角色創作平臺)、通義點金(智能投研助手)、通義曉蜜(智能客服助手)、通義仁心(個人健康助手)、通義法睿(AI法律顧問)。同時,通義千問正式上線APP,所有用戶都可通過“通義APP”直接體驗最新模型能力;開發者可以通過網頁嵌入、API/SDK調用等方式,將上述所有模型集成到自己的AI應用和服務中。

基於通義大模型的開源屬性,商業化更是一個復雜的挑戰。

「科技新知」梳理下來,目前大模型的商業化模式大致可分為四類。從C端市場來看:一是直接提供API接口,用戶通過按量使用來收費;二是大模型賦能產品帶來的需求與價格增長,如chatGPT、Midjourney等產品的付費使用。從B端市場來看,一是AI功能帶來的流量增長,進而收取廣告費用;二是通過AI對企業內部賦能,幫助企業降本增效,如文心大模型接入百度系產品,幫助產品提效。

目前看來,阿裡似乎是在ToB和ToC的商業化道路上同時摸索前行。2023年4月,阿裡巴巴宣佈所有產品未來將接入“通義千問”大模型,進行全面改造。而在企業賦能上,阿裡雲把從飛天雲操作系統、芯片到智算平臺的“AI+雲計算”這些AI基礎設施和通義大模型能力向所有企業開放,未來每一個企業既可以調用通義千問的全部能力,也可以結合企業自己的行業知識和應用場景,訓練自己的企業大模型。同時,通義靈碼、通義智文、通義聽悟等在內的八款產品模型,也受到不少C端用戶的肯定。

變現之路尚未明朗,AI大模型的價格戰卻已經打響。今年5月以來,字節、阿裡、百度、智譜AI等多傢國內大模型廠商均調整旗下大模型產品的定價策略,通義千問主力模型Qwen-long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。

這也深層次反應大模型廠商在技術、市場和戰略等多方面的競爭到來。從商業化的角度來說,純粹的價格戰能在短期吸引用戶,形成頭部的虹吸效應,但長期選擇上,沒有技術創新作為支撐,難以形成持久的競爭優勢。

大模型落地應用想象空間巨大,但落地難度同樣不小。例如,將大模型直接應用於具體場景,比如醫療健康或法律咨詢領域時,實際操作的挑戰便顯現出來。

在降本增效的大背景下,B端客戶在選擇大模型時也會更加註重成本和收益。如何通過細分市場企業精準定位市場需求,提供針對性解決方案,也是通義大模型在商業化佈局中需要深思的。

而在C端市場,對於大多數消費者來說,AI技術的實用性尚未達到不可或缺的地步,各傢應用的功能目前也並非不可替代。

這是通義大模型商業化的困境,也是多數AI大模型企業的難題。


相關推薦

2024-02-23

近日,美國OpenAI公司發佈的AI視頻生成模型Sora,引發全球關註。伴隨著Sora大火,李一舟因199元AI課,一年賣5000萬元而登上熱搜,被戲稱為“AI大神”、AI“教”父。2月22日午間,記者搜索發現,李一舟用於售賣AI課程的微信小程

2023-12-06

“夏傳武去哪兒?”早在2018年,卓翼科技﹙002369.SZ﹚時任董事長夏傳武一度“消失”,很多人問出這個問題。當時,這傢進入小米供應鏈的上市公司董事會發生人事巨變,多個核心人物集體離職,並演繹罕見的“通知之急、開

2023-10-22

TechWeb文/卞海川近日,曾經與蔚來汽車、小鵬汽車並稱“新勢力三巨頭”的威馬汽車申請破產,此消息一出引起業內不小的震動,而感受到震動最大的則是威馬汽車的用戶們。不知是巧合,還是其他原因,就在威馬申請破產的同

2024-07-20

的現實:如果手機業務無法繼續,公司三四萬員工的未來將何去何從?面對這一挑戰,小米啟動一場深入的調研,探索新的發展方向。在這個過程中,造車的想法首次被提上議程。經過一周的深思熟慮,雷軍決定親自帶隊,投身

2024-03-09

果。Paul Trillo 對 indiewire 表示:“也許兩年後會出現一種開源模式,可以給到電影制片人很大的控制權,提供出他們所需要的細節。”作為一項 2 月才推出的尚未向公眾開放的技術,Sora 發佈後在娛樂行業引起不小轟動,但 AI 對

2024-03-06

比如投入重金的造車計劃直接爛尾,又或是遲來的自研大模型,以及在AI硬件/折疊屏手機/影像手機等產品創新上的步履蹣跚。強如蘋果,也很難“良將如潮”。高管頻繁出走,蘋果在憋什麼超級大招?AI是超級智力密集型產業,

2023-11-16

一份舉報材料橫空出世,讓交個朋友這傢身處杭州的明星直播電商企業站上輿論的風口浪尖。11月13日,交個朋友前副總裁妻子發佈一份名為《舉報交個朋友副總裁方翔七宗罪》的60頁PDF長文,控訴方翔婚內出軌、職務侵占、商業

2023-04-17

這個周末,歐洲核電行業迎來兩大截然相反的標志性事件:在芬蘭,經歷14年拖期的Olkiluoto3(下稱OL3)核電機組從4月16日開始投入日常運營,今後將為芬蘭提供約30%的電力;隨著最後三座核電站停止運行,4月15日起,德國核電正

2022-08-30

8月16日早間,小牛電動公佈2022年第二季度財報。數據顯示,2022年第二季度實現營收8.276億元(人民幣,下同),同比下降12.4%。2022年第二季度實現凈利潤1440萬元,去年同期為9180萬元,同比下降84.3%。早在7月5日,小牛電動就發

2023-12-02

沖突,或許也潛藏隔閡與分歧。另一方面,如何杜絕“CEO突遭解雇”的情節,也將是Sam面臨的另一個核心命題。在公開信中,Sam也提到或將優化治理結構,“強化”自己作為公司合夥人的角色,他寫道:“Greg和我是這傢公司的

2023-11-20

管商討如何盡早設計出新的芯片,為OpenAI這樣的大型語言模型公司降低成本。目前還不清楚阿爾特曼是代表OpenAI,還是代表潛在的新公司參加討論。被OpenAI趕下臺後,阿爾特曼告訴投資者,他計劃成立一傢新的AI公司,佈羅克曼

2023-11-19

政變”面臨戲劇性反轉,聯合創始人伊利亞和現任董事會將何去何從?據The Verge報道,包括伊利亞、Adam D‘Angelo等5位董事會成員,原則上已同意辭職,並允許奧特曼和佈羅克曼回歸OpenAI。這意味著,伊利亞將會出局,但暫不確

2023-01-16

己的遊戲和存檔怎麼辦外,自己真金白銀買下的Stadia手柄何去何從,也是一個相當重要的問題。對此,今天谷歌正式宣佈,將在下周發佈一個更新,為Stadia手柄加入藍牙支持,讓其他硬件也能夠適配該手柄。事實上,Stadia手柄本

2023-01-23

月球發動機首次曝光,“太陽危機”一觸即發,人類命運何去何從引發巨大懸念。