Stability AI發佈免費音頻生成工具 可創作AI歌曲


著名大模型開源平臺StabilityAI發佈音頻生成模型StableAudio2.0,現在允許用戶上傳自己的音頻樣本,然後通過提示轉換音頻樣本並免費創造AI生成的歌曲。StableAudio的第一版在2023年9月發佈時,僅為一些付費用戶提供最多90秒的音頻,這意味著用戶隻能制作短音頻片段來實驗。

而Stable Audio 2.0提供完整的三分鐘音頻片段,這個長度的歌曲大多數適合電臺播放,而所有上傳的音頻必須是無版權的。

據解,與OpenAI的音頻生成模型Voice Engine隻向一小部分用戶開放不同,Stability AI通過其網站免費向公眾提供Stable Audio,未來將很快提供API接口。


Stability AI表示,Stable Audio 2.0與其早期版本的一個主要區別在於,它能夠創建與真實歌曲相似的歌曲結構,包括有序幕、進展和尾聲。

不過,已經試玩Stable Audio 2.0的媒體表示,這個水平的AI歌曲距離幫助用戶用音樂表達想法,差距依然比較大。例如,有用戶用“帶有美國風格的民謠流行歌曲”(美國鄉村音樂)作為提示,Stable Audio生成的歌曲在某些部分聽起來有山谷清晨的氛圍,並且疑似加入人聲。

理論上,Stable Audio 2.0的新功能允許用戶調整生成的AI音頻作品,使作品更符合用戶的聽歌風格。例如可以調整遵循提示程度,或設置轉換所上傳音頻的哪一部分,用戶還可以添加像人群的吼聲或鍵盤敲擊等音效。

然而,這種AI歌曲最大的問題在於,讓人感覺毫無靈魂。但這並不令人感到驚訝,因為這和其他大廠的AI音頻問題一樣。例如,如Meta和Google也一直在嘗試AI音頻生成,但兩傢公司都沒有公開發佈他們的模型,因為他們仍在收集開發者的反饋,來解決AI歌曲無靈魂的問題。

Stability AI在一份新聞稿中說,Stable Audio是在AudioSparx的數據上訓練的,後者擁有超過800,000個音頻文件的庫。

不過,這些音頻可能出現版權糾紛。Stability AI表示,作品被納入AudioSparx的藝術傢可以選擇退出,以避免他們的作品用於訓練模型。其實,使用版權音頻訓練模型是Stability AI的前音頻副總裁Ed Newton-Rex在Stable Audio發佈後不久就離開公司的原因之一。對於2.0版本,Stability AI說它與Audible Magic合作,使用其內容識別技術來追蹤和阻止版權音頻進入平臺。

總之,Stable Audio 2.0的確讓AI歌曲比之前更像真正的歌曲,但還是沒有完全達到這個目標。媒體表示,如果Stable Audio 2.0模型堅持添加某種人聲,也許下一個版本的AI音頻作品會出現更能令人分辨的語言。


相關推薦

2024-09-06

文本描述生成和編輯圖像。它是首款使用最新、最先進的Stability AI模型Stable Diffusion 3.0的PC應用程序。聯想獨有的內部圖像生成應用程序,免費、簡單易用和功能強大。Creator Zone在預裝或可在部分聯想AI PC上下載,無需訂閱即可使

2023-02-13

,麥柯南成為集體訴訟的三名原告之一,起訴對象包括:Stability AI 是一傢總部位於倫敦的公司,該公司與他人共同開發 Stable Diffusion;Midjourney,一傢位於舊金山的初創公司,使用 Stable Diffusion 為基於文本的圖像創建提供支持;De

2023-02-11

一步擴展到圖像生成領域,代表產品包括OpenAI的Dall-E2、Stability AI的開源型Stable Diffusion,以及Midjourney等系統。隨著這些技術成果的出現,人們開始蜂擁為這些技術尋找各種新的應用場景。預料新應用將會大量出現,可能足以比擬

2022-10-09

。以爆火的StableDIffusion為例,背後總部在英國的初創公司Stability AI,項目發佈一個月估值就已超10億美元。而由於StableDIffusion完全開放,在此基礎上又誕生不少公司,比如StableDIffusion的搜索引擎Lexica,目前已獲500萬美元融資。量

2022-12-21

是將工具關在籠子裡,僅開放給少數受信任的用戶使用;Stability AI 在最新發佈的 2.0 版本的訓練數據集中刪除大部分含有不良信息的數據,同時在軟件許可協議中明確規定不允許創建人物圖像。但政策性的規定畢竟指標不治本,

2024-03-24

3月23日消息,總部位於英國倫敦的AI圖像生成頭部玩傢Stability AI突然宣佈公司 CEO Emad Mostaque 辭職。隨後,Emad Mostaque 在社媒平臺 X 上宣佈,自己離職後將致力於去中心化人工智能(DecentralizedAI)。Stability AI 公司在官網博客文章中

2022-09-10

速攀升到10億美元(約合人民幣69億)。知情人士透露,StabilityAI正在籌備一輪融資,金額為1億美元(約合人民幣6.9億元)。在此之前,它們才以1億美元估值,通過SAFE票據至少融資1000萬美元。如今,隨著多方投資機構透露出對 S

2023-04-14

新大語言模型組成;同時支持調用來自AI21 Labs、Anthropic、Stability AI等第三方的多樣化模型。目前,OpenAI開放ChatGPT的API,但微軟、谷歌並未推出類似的PaaS開放平臺。同時,Bedrock一個核心特征是支持企業自定義基礎模型,隻需少量

2022-09-30

傢的藝術插圖。而Meta最新推出的Make-A-Video工具則讓AI藝術生成工具更近一步,隻要一些簡單的文字就可以生成視頻。結果令人印象深刻且多種多樣,而且毫無例外地都有些令人毛骨悚然。我們以前見過文本到視頻模型——它是文

2023-03-27

t的AI編程工具抄襲代碼。今年1月,一群藝術傢起訴AI繪畫Stability AI Ltd.、Midjourney Inc.和DeviantArt Inc.,聲稱這些公司下載並使用數十億張受版權保護的圖像,但沒有獲得藝術傢的授權並對其進行補償。一場AIGC的版權風暴正在來

2024-04-10

像外延和內填技術,已被其他文本轉圖像模型采用,例如Stability AI的Stable Cascade和Getty的Generative AI by iStock。此外,這些技術也被廣泛應用於消費電子產品中,如三星Galaxy手機。除圖像生成的創新外,谷歌還公開展示一種結合人工

2023-08-11

為259美金(約合人民幣1800元),將於8月17日在美國正式發佈,國內將於8月17日20:00在智度股份&國光電器董事長陸宏達抖音直播間、丹麥Vifa音響抖音直播間以及唯品會Vifa直播間同步直播首次亮相。

2023-02-25

公司“看而不摸”的做法感到失望。2022年8月,一傢名為Stability AI的倫敦初創公司發佈一款文本到圖像的工具Stable Disusion,向公眾開放。一時間,Stable Diffusion很快成為熱門話題。數百萬用戶被其從零開始創作藝術的能力所吸引,

2023-04-06

。與之類似的AI圖像生成器還包括OpenAI開發的DALL-E,以及Stability AI與慕尼黑大學(LMU)合作研發的Stable Diffusion。雖然使用的訓練模型略有差異,這些工具的共同點在於,它們都能將簡單的文字描述轉化成圖像輸出。左圖來自Midjou