“讓黴黴中文開口跪”的AI有開源平替 每月立省350


能讓黴黴中文開口跪、郭德綱用英語說相聲的那個AI——有開源平替!這是用它讓羅翔進行英文普法的效果,張三李四“要素齊全”:以及英文講人生哲理“你的內心有沒有幽暗的成分”(cr:linexiongjielin):相比起來,雖然和原產品(也就是HeyGen)有一點差距,但是網友的評價是:也還可以。

主要有它,咱們在本地就能無限玩視頻翻譯,直接好處那可就是每月立省350~(手動狗頭)

畢竟,HeyGen再厲害,也隻有2分鐘免費時長。

△ HeyGen收費情況

具體瞧瞧。

HeyGen開源平替來

這個視頻翻譯平替名叫MyHeyGen,來自b站UP主:@ai浮世繪。

除英文,MyHeyGen還支持轉法語、日語等共計16種語言。

視頻翻譯的三個流程:音頻翻譯、翻譯校正和視頻唇紋合成,它全部一個流程解決。

如果你想親手試試,步驟也不復雜。

大概流程是先環境準備:

需要分別去Huggface申請個token、去百度翻譯申請個AppKey,並下載權重和checkpoints文件。

然後就可以git clone安裝。

開始測試之前,記得將你要翻譯的視頻下載保存到本地。

然後在執行命令中提供其保存路徑+想要翻譯成的語言代碼(比如’en’代表英語)+翻譯好的視頻保存路徑就可以坐等。

命令的完整格式如下:

python translate.py 原視頻文件路徑 目標語言代碼 -o 保存路徑

有網友實測成功:

不過,還是必須得滿足16G顯存才ok,以及windows用戶可能需要自己再解決一下兼容問題(up主該視頻底下有人提供方法)。

如果這些都不行,可以再等等colab實現,up主表示在測試中。

效果方面,可以發現MyHeyGen音色復刻得很是到位,用最新的語音克隆開源技術XTTS v2。

投喂給AI一個明星的采訪視頻,它就能克隆其中的聲音講不同的話。

至於MyHeyGen的缺點,大傢看完表示也明顯。

比如有人反映口形有一些不同步,有人則吐槽遇上面部大幅活動就容易“抽風”(如本段開頭的“這英”)等等。

但整體玩一玩還是ok的。

One More Thing

仔細一翻,HeyGen的開源替代品還真不少。

有俄羅斯程序員也在業餘時間做一個:HeyGenClone。

用的是谷歌翻譯,可以支持上百種目標語言,但隻支持原語言為英文的視頻。

由於隻給一個很短的俄語效果展示,不是很好評鑒,這裡就不放視頻~

參考鏈接:

[1]https://twitter.com/dotey/status/1722543725459452211

[2]https://twitter.com/gorden_sun/status/1722439866112463163


相關推薦

2023-04-16

”OpenAssistant 的回答相對而言更有條理性。03.體驗下來,中文不太行目前的 Open Assistant 基於“OA_SFT_Llama_30B”模型,最大新 token 的數量為 1024,支持英文、中文、日語等數十種語言。先讓它做一下自我介紹。然而在中文對話體驗

2023-04-20

像生成工具StableDiffusion的創業公司StabilityAI宣佈,發佈並開源該團隊訓練的大語言模型StableLM。根據該團隊的公告,目前StableLM的“阿爾法版本”中擁有30億和70億參數的模型已經可以從GitHub等開源平臺上下載,後續還將推出150億

2024-06-27

快科技6月27日消息,全球知名的開源平臺Hugging Face的聯合創始人兼首席執行官Clem在社交平臺激動宣佈,阿裡巴巴最新開源的Qwen2-72B指令微調版本在開源模型排行榜上榮登榜首。為打造一個更為公正和準確的開源大模型排名,Clem

2023-04-14

來一場革命。其中,尤其引人註目的是一傢名為Hugging Face開源創業公司。目前,Hugging Face已經是全球最受歡迎的開源機器學習社區和平臺,不僅創下GitHub有史以來增長最快的AI項目記錄,估值也一路沖破20億美元。近期,微軟和

2023-04-27

4月25日,構建大型開源社區的AI初創公司HuggingFace(抱抱臉)宣佈推出開源聊天機器人HuggingChat。與ChatGPT類似,HuggingChat可以完成一些復雜的生成任務,包括編寫代碼、起草電子郵件、創作歌詞等等,號稱“開源版Android應用商店

2024-04-19

周鴻禕,他在海外演講時暗懟,“有些名人胡說八道,沒有開源就沒有互聯網”。連潑兩盆冷水短短一個星期內,李彥宏給開源大模型的這盆冷水,潑兩次。第一次是4月11日晚間,李彥宏的一封內部講話被媒體“曝光”。他表示

2024-02-23

成式 AI 的版權問題尚未被法律正式界定時,主張普惠、開源的社區和創作者們,該如何保證自己的模型所有權不被侵犯、甚至模型不被某些個體濫用?這次事件或許是一個思考的開始。01、學員付費使用的模型,搬運自開源網站

2023-04-25

閱讀文本就能實現的,這才是未來幾年的最大挑戰之一。開源才是盡頭對權力的渴望,是人類特有的。而AI並不會因為變得越來越強大就會具備這種渴望。隻有人類這個物種才知道如何制定法律,保障個體的行為不會過多損害共

2024-04-04

著名大模型開源平臺StabilityAI發佈音頻生成模型StableAudio2.0,現在允許用戶上傳自己的音頻樣本,然後通過提示轉換音頻樣本並免費創造AI生成的歌曲。StableAudio的第一版在2023年9月發佈時,僅為一些付費用戶提供最多90秒的音頻,

2023-12-19

間達到14.58天。徐可馨稱,想要手機續航時間更長,就隻有開源節流”的途徑,在開源方面,努比亞Z60 Ultra采用行業內目前最好的矽碳負極電芯。在保持電池空間不變的情況下,努比亞Z60 Ultra搭載高達6000mAh的超大電池,能量密度

2023-07-19

也反映紮克伯格的AI策略:免費開放。Meta將Llama2定位為“開源軟件”,允許公眾對其廣泛使用、修改或共享。紮克伯格周二在臉書上發帖稱:“開源推動創新,因為它能夠讓更多開發者使用新技術進行開發。它還提高安全性,因為

2023-11-15

3PB原始數據精選到3T token高質量數據)。在零一萬物初次開源過程中,我們發現用和開源社區普遍使用的LLaMA 架構會對開發者更為友好,對於沿用LLaMA部分推理代碼經實驗更名後的疏忽,原始出發點是為充分測試模型,並非刻意

2024-03-04

ies)宣佈推出Tazama,這是一款用於實時欺詐預防的開創性開源軟件解決方案。此次發佈是數字金融服務發展過程中的一個裡程碑,推出有史以來第一個專門用於加強數字支付欺詐管理的開源平臺。Tazama 標志著全球金融監管和合

2024-03-29

核中。中國Arm公司的神經處理單元(NPU)驅動程序目前擁有開源內核和用戶空間堆棧。三年前,百度的一位工程師曾關註過用於 Linux 內核的周易 AI 加速器驅動程序,但這隻是一個開源的內核驅動程序,當時還缺乏一個開源的用