StabilityAI的最新圖像生成模型StableCascade承諾比其業界領先的前身StableDiffusion更快、更強大,而StableDiffusion是許多其他文本到圖像生成AI工具的基礎。
Stable Cascade 可以生成照片,並對所創建的圖片進行修改,或嘗試提高現有圖片的分辨率。其他文本到圖片的編輯功能還包括內畫和外畫(模型隻對圖片的特定部分進行填充編輯),以及可視邊緣(用戶可利用現有圖片的邊緣制作新照片)。
新模型可在GitHub 上供研究人員使用,但不能用於商業用途。在Google甚至蘋果等公司發佈自己的圖像生成模型時,新模型也帶來更多選擇。
與 Stability 的旗艦產品 Stable Diffusion 模型不同,Stable Cascade 並不是一個大型語言模型,而是三個不同的模型,它們都依賴於Würstchen 架構。
Stable Cascade與其他模型的推理時間比較
將請求分解成更小的比特後,請求所需的內存更少(在那些很難找到的 GPU 上訓練的時間也更少),運行速度更快,同時在"提示對齊和美學質量"方面表現更佳。創建一幅圖像大約需要 10 秒,而目前使用的 SDXL 模型需要 22 秒。
Stability AI公司幫助普及Stable Diffusion方法,同時也成為幾起訴訟的對象,這些訴訟指控Stable Diffusion公司在未經權利人許可的情況下對受版權保護的數據進行訓練 - Getty圖片公司對Stability AI公司的訴訟將於 12 月開庭審理 。該公司於 12 月開始通過訂閱的方式提供商業許可,並表示這是幫助其研究獲得資金所必需的。