AI孫燕姿翻唱爆火多虧這個開源項目 廣西老表帶頭打造


AI孫燕姿這麼快翻唱這麼多首歌,到底是咋實現的?關鍵在於一個開源項目。最近,這波AI翻唱趨勢大火,不僅是AI孫燕姿唱的歌越來越多,AI歌手的范圍也在擴大,就連制作教程都層出不窮。

圖片

而如果在各大教程中溜達一圈後就會發現,其中的關鍵秘訣,還是要靠一個名為so-vits-svc的開源項目。


它提供一種音色替換的辦法,項目在今年3月發佈。

貢獻成員應該大部分都來自國內,其中貢獻量最高的還是一位玩明日方舟的廣西老表。


如今,項目已經停止更新,但是星標數量還在蹭蹭上漲,目前已經到8.4K。

所以它到底實現哪些技術能引爆這波趨勢?

一起來看。

多虧一個開源項目

這個項目名叫SoftVC VITS Singing Voice Conversion(歌聲轉換)。

它提供一種音色轉換算法,采用SoftVC內容編碼器提取源音頻語音特征,然後將矢量直接輸入VITS,中間不轉換成文本,從而保留音高和語調。

此外,還將聲碼器改為NSF HiFiGAN,可以解決聲音中斷的問題。

具體分為以下幾步:

預訓練模型

準備數據集

預處理

訓練

推理

其中,預訓練模型這步是關鍵之一,因為項目本身不提供任何音色的音頻訓練模型,所以如果你想要做一個新的AI歌手出來,需要自己訓練模型。

而預訓練模型的第一步,是準備幹聲,也就是無音樂的純人聲。

很多博主使用的工具都是UVR_v5.5.0

Twitter博主@歸藏介紹說,在處理前最好把聲音格式轉成WAV格式,因為So-VITS-SVC 4.0隻認這個格式,方便後面處理。

想要效果好一些,需要處理兩次背景音,每次的設置不同,能最大限度提高幹聲質量。

得到處理好的音頻後,需要進行一些預處理操作。

比如音頻太長容易爆顯存,需要對音頻切片,推薦5-15秒或者再長一點也OK。

然後要重新采樣到44100Hz和單聲道,並自動將數據集劃分為訓練集和驗證集,生成配置文件。再生成Hubert和f0。

接下來就能開始訓練和推理。

具體的步驟可以移步GitHub項目頁查看(指路文末)。

值得一提的是,這個項目在今年3月上線,目前貢獻者有25位。從貢獻用戶的簡介來看,很多應該都來自國內。

據說項目剛上線時也有不少漏洞並且需要編程,但是後面幾乎每一天都有人在更新和修補,現在的使用門檻已經降低不少。

目前項目已經停止更新,但還是有一些開發者創建新的分支,比如有人做出支持實時轉換的客戶端。


項目貢獻量最多的一位開發者是Miuzarte,從簡介地址判斷應該來自廣西。


隨著想要上手使用的人越來越多,也有不少博主推出上手難度更低、更詳細的食用指南。

歸藏推薦的方法是使用整合包來推理(使用模型)和訓練,還有B站的Jack-Cui展示Windows下的步驟指南。

需要註意的是,模型訓練對顯卡要求還是比較高的,顯存小於6G容易出現各類問題。

Jack-Cui建議使用N卡,他用RTX 2060 S,訓練自己的模型大概用14個小時

訓練數據也同樣關鍵,越多高質量音頻,就意味著最後效果可以越好。

還是會擔心版權問題

值得一提的是,在so-vits-svc的項目主頁上,著重強調版權問題。

警告:請自行解決數據集的授權問題。因使用未經授權的數據集進行培訓而產生的任何問題及其一切後果,由您自行承擔責任。存儲庫及其維護者、svc開發團隊,與生成結果無關!


這和AI畫畫爆火時有點相似。

因為AI生成內容的最初數據取材於人類作品,在版權方面的爭論不絕於耳。

而且隨著AI作品盛行,已經有版權方出手下架平臺上的視頻。

據解,一首AI合成的《Heart on My Sleeve》在油管和Tik Tok上爆火,它合成Drake和Weekend演唱的版本。

但隨後,Drake和Weekend的唱片公司環球音樂將這個視頻從平臺上下架,並在聲明裡向潛在的仿冒者發問,“是要站在藝術傢、粉絲和人類創造性表達的一邊,還是站在Deepfake、欺詐和拒付藝術傢賠償的一邊?”

此外,歌手Drake也在ins上對AI合成翻唱歌曲表達不滿。

而另一邊,也有人選擇擁抱這項技術。

加拿大歌手Grimes表示,她願意讓別人使用自己的聲音合成歌曲,但是要給她一半版權費。


相關推薦

2023-05-12

5月12日消息,一夜之間AI孫燕姿”火遍全網。在B站上,AI孫燕姿翻唱的林俊傑《她說》、周董《愛在西元前》、趙雷《成都》等等,讓一眾網友深陷無法自拔。網友表示,聽一晚上AI孫燕姿,出不去......這些翻唱作品基於一個叫

2023-05-15

以模擬生成和目標音色相同的聲學模型。近日,“AI歌手孫燕姿”熱度非常高,在B站有關“AI孫燕姿”相關的視頻已經有上千條,其他的翻唱歌曲播放量也有著非常高的播放量。有網友評論稱,AI翻唱太像,我能循環聽一個晚上

2023-05-13

快科技5月13日消息,這兩天,#AI出來後第一個失業的是孫燕姿#的話題被推上熱搜。此事源於AI孫燕姿”的走紅。據解,這位一夜爆紅的虛擬歌手在AI技術的加持下,對孫燕姿的聲音數據進行訓練得到模型,通過模型推理,最終實

2023-11-22

消息,據國內媒體報道稱,廣西南寧的桂花牌”手表突然爆火,有人為買到它,居然開始排號。從目前情況看,有人從凌晨1點開始排隊,有人求代購,還有加價5倍出售(萬元) 這些爆火的款式多為上世紀90年代的庫存產品。對

2022-09-10

在StableDiffusion以“免費開源”爆火AI畫畫圈後,背後公司的估值快速攀升到10億美元(約合人民幣69億)。知情人士透露,StabilityAI正在籌備一輪融資,金額為1億美元(約合人民幣6.9億元)。在此之前,它們才以1億美元估值,通

2022-11-09

加入雲管理程序項目,並成為顧問委員會的成員。AMD加入這個由英特爾發起的Rust編寫的VMM開源項目並不完全令人驚訝,盡管考慮到它已經開始獲得一些行業的吸引力。此外,追溯到2020年是實驗性的AArch64支持,Arm也最終成為Cloud

2024-03-30

縮軟件廣泛使用,但在之前隻有一名活躍的貢獻者在維護這個項目。這個孤獨的貢獻者可能因為精力不夠或者其他原因,在遇到一名新的貢獻者時,隨著時間的推移,在獲取信任後,這名新貢獻者逐漸獲得項目的更多控制權。實

2022-09-21

多為加速GPU計算而設計的其他開源項目一樣。無論如何,這個新項目就是CV-CUDA,它是一個開源項目,旨在處理圖像的前期和後期處理,以加速計算機視覺(CV)工作負載。CV-CUDA開源庫旨在幫助建立加速的端到端計算機視覺和圖

2023-09-09

Win98,但 Linux 成為眾多領域的支柱鄒欣:近半年 ChatGPT 的爆火讓 OpenAI 的成功大受矚目,你如何看待此事?Brian:我不知道 OpenAI 現在有多開放,但它無疑利用現存的所有開源工具訓練大量的數據,將 GPT-1迭代到 GPT-4。從某些角度來

2022-11-24

開源之夏 2022 已經接近尾聲,本年度共有 124 個開源社區發佈 502 個項目任務;915 名學生成功遞交 1319 份項目申請書,覆蓋到全球 19 個國傢的 385 所高校,449 名學生中選,開啟開源之旅。歷經 3 個月的項目開發時間,最終,350

2023-04-03

乎是想要玩轉音視頻的必備技能。不過話又說回來,憑啥這個看著像一串驗證碼的東西,能夠成為許多開發者的必修課?因為我們日常生活中再熟悉不過的各種音頻和視頻播放器,還真就離不開 FFmpeg 的功勞。這個 “ 驗證碼 ”

2023-04-25

並不會因為變得越來越強大就會具備這種渴望。隻有人類這個物種才知道如何制定法律,保障個體的行為不會過多損害共同利益。OpenAI最初是一個開放的研究項目,現在已經關閉。而OpenAI對其工作隻字未提,這種情況的逆轉在研

2022-11-13

ter的90納米工藝。早在8月,Google和GlobalFoundries宣佈創建一個開源的工藝設計工具包(PDK),以後者的180納米"180MCU"技術平臺為目標。在最初的公告中暗示,Google將繼續提供其"無成本矽實現計劃",為那些完成成功的

2022-08-28

隨著現在智能手機的配置越來越好,人們對於手機各方面的要求也越來越高。除處理器、屏幕和相機等主要配置之外,像是振動馬達、揚聲器等這種以往不太引人註意的配置,也逐漸被人重視起來。尤其是振動馬達這方面的調教