在StableDiffusion以“免費開源”爆火AI畫畫圈後,背後公司的估值快速攀升到10億美元(約合人民幣69億)。知情人士透露,StabilityAI正在籌備一輪融資,金額為1億美元(約合人民幣6.9億元)。在此之前,它們才以1億美元估值,通過SAFE票據至少融資1000萬美元。
如今,隨著多方投資機構透露出對 Stability AI 的興趣,其估值也從 1 億美元、5 億美元、最終飆升到 10 億美元。而現在距離 Stable Diffusion 對外發佈,才過去一個月。
而且,Stability AI 連明確的商業模式都還沒有形成 ——Stable Diffusion 僅是一個在 GitHub 上對外開源的免費項目。創始人向外界表示,對此不用擔心,因為他們已經和政府等機構達成合作。
開放?營利?
Stable Diffusion 的爆火,主要靠的是足夠開放。和 Dall・E、Midjourney 不同,它是完全免費、不限次數、任何人都可用的。對硬件的要求也不高,普通顯卡上就能跑,顯存不到 10GB,也能在幾秒鐘內生成高清圖像。
生成效果上,可以說完全不亞於 Dall・E、Midjourney,因此在社交平臺上風靡一時。
目前在 GitHub 上已經攬星超過 2 萬。
但爭議也隨之而來。前段時間,由於 Stable Diffusion 使用過於泛濫,牽涉到藝術版權的問題,一群藝術傢們還吵起來,並把一個非官方賬號舉報到封號。
它對外開源的特性,對生成圖像的監管程度更低,不少人拿它來生成虛假名人照片等違禁圖片。Reddit 已經禁掉 4 個專門用 Stable Diffusion 生成敏感圖片的社區。
顯然,開源這件事給 Stable Diffusion 帶來超高關註度的同時,也帶來一些麻煩。加之它的代碼就放在 GitHub 上,這使得別人可以輕而易舉高仿一個 Stable Diffusion 出來。
前不久,一傢公司照著 Stable Diffusion 做個盜版,名叫 Photosonic AI,結果在產品社區 Product Hunt 上直接排到第二名。
Stable Diffusion 的項目基礎是由慕尼黑大學機器視覺與學習研究小組和 Runway 的研究人員,基於 CVPR2022 的一篇論文《High-Resolution Image Synthesis with Latent Diffusion Models》,並與其他社區團隊合作開發的一款開源模型。
以及關鍵問題 —— 開源項目如何賺錢?Stability AI 還沒有給出明確的商業模式。目前,該公司的大部分資金直接來自創始人兼 CEO 伊馬德・莫斯塔克。
他現在 39 歲,2005 年碩士畢業於牛津大學數學和計算機科學專業。之前在英國做過對沖基金工作。2019 年,和其他人一起創立一個項目 Symmitree,旨在為人們降低使用智能手機、上網的成本(不過現在似乎已經關閉)。
2020 年,他正式聯合創立 Stability AI。公司的使命被定為“構建開源 AI 項目”,除 Stable Diffusion 外,該公司還支持其他開源小組正在研發的工具。
在一次油管上的采訪中,莫斯塔克透露,他們已經和政府等機構達成合作,談成很多訂單來售賣他們的技術。並且他還表示,模型第一階段的訓練成本僅為 600 萬美元,“這隻是公司資金的一小部分”。
據解,該模型訓練是在 4000 個 A100 Ezra-1 AI 超大集群上完成的。莫斯塔克表示,公司之前是完全獨立的,除 75 位員工外,沒有其他任何控股方。
現在,他們要以 10 億美元的估值,把 10% 的股份拿出來吸引投資者註資。Lightspeed、Coatue 等知名風投公司,都將是這一席位的有力競爭者。
One More Thing
值得一提的是,Stability AI 因為提倡開源項目,不免會讓人聯想起 OpenAI。在接受微軟的投資後,OpenAI 轉為營利性組織,開始專註於將技術商業化,由此也引發一些批評。
不過,Stability AI 似乎從一開始就是以營利為目的的公司,創始人莫斯塔克表示,“這樣開源項目可以惠及到更多人。”
參考鏈接:
[1]https://www.forbes.com/sites/kenrickcai/2022/09/07/stability-ai-funding-round-1-billion-valuation-stable-diffusion-text-to-image/?sh=2a268ea424d6
[2]https://techcrunch.com/2022/08/12/a-startup-wants-to-democratize-the-tech-behind-dall-e-2-consequences-be-damned/