当前位置:   article > 正文

“让霉霉中文开口跪”的AI有开源平替了!每月立省350(doge)

代替heygen github
丰色 发自 凹非寺
量子位|公众号QbitAI

让霉霉中文开口跪郭德纲用英语说相声的那个AI——

有开源平替了!

这是用它让罗翔进行英文普法的效果,张三李四“要素齐全”:

以及英文讲人生哲理“你的内心有没有幽暗的成分”(cr: line xiongjie lin):

相比起来,虽然和原产品(也就是HeyGen)有一点差距,但是网友的评价是:

也还可以。

d86a8ab2fb27daf58480168d13487dad.png

主要有了它,咱们在本地就能无限玩视频翻译,直接好处那可就是每月立省350~(手动狗头)

毕竟,HeyGen再厉害,也只有2分钟免费时长。

b9ef7d1e120904f36a598c43a9ea491b.png HeyGen收费情况

具体瞧瞧。

HeyGen开源平替来了

这个视频翻译平替名叫MyHeyGen,来自b站UP主:@ai浮世绘

36bd60cefda0911c7ff6a9b72c0855f9.png

他的首页里还有很多效果展示,比如这个新鲜出炉的“这英”

除了英文,MyHeyGen还支持转法语、日语等共计16种语言。

视频翻译的三个流程:音频翻译、翻译校正和视频唇纹合成,它全部一个流程解决。

如果你想亲手试试,步骤也不复杂。

大概流程是先环境准备:

需要分别去Huggface申请个token、去百度翻译申请个AppKey,并下载权重和checkpoints文件。

然后就可以git clone安装了。

开始测试之前,记得将你要翻译的视频下载保存到本地。

然后在执行命令中提供其保存路径+想要翻译成的语言代码(比如’en’代表英语)+翻译好的视频保存路径就可以坐等了。

命令的完整格式如下:

python translate.py 原视频文件路径 目标语言代码 -o 保存路径

有网友实测成功

3f913ef49265d7547878596bce2c4f87.png

不过,还是必须得满足16G显存才ok,以及windows用户可能需要自己再解决一下兼容问题(up主该视频底下有人提供了方法)。

如果这些都不行,可以再等等colab实现,up主表示在测试中了。

效果方面,可以发现MyHeyGen音色复刻得很是到位,用了最新的语音克隆开源技术XTTS v2

06ce00cf7db94d3c6f6275163ad6cda2.png

投喂给AI一个明星的采访视频,它就能克隆其中的声音讲不同的话。

这是推特博主@Gorden Sun用霉霉的声音测试的一个效果:

至于MyHeyGen的缺点,大家看完表示也明显。

比如有人反映口形有一些不同步,有人则吐槽遇上面部大幅活动就容易“抽风”(如本段开头的“这英”)等等。

但整体玩一玩还是ok的。

One More Thing

仔细一翻,HeyGen的开源替代品还真不少。

有俄罗斯程序员也在业余时间做了一个:HeyGenClone

df4b00bbdf21a958c06e5585d4a6a7f9.png

用的是谷歌翻译,可以支持上百种目标语言,但只支持原语言为英文的视频。

由于只给了一个很短的俄语效果展示,不是很好评鉴,这里就不放视频了~

参考链接:
[1]https://twitter.com/dotey/status/1722543725459452211
[2]https://twitter.com/gorden_sun/status/1722439866112463163

《2023年度十大前沿科技报告》案例征集

量子位智库《2023年度十大前沿科技报告》,启动案例征集。诚邀顶级研究机构、一流投资大咖、前沿科技创新公司,参与共创,分享案例。

扫描图片二维码参与前沿科技案例征集。了解更多细节可联系报告负责人:郑钰瑶(微信:CarolineZheng_,请备注企业+姓名)。

208bc73bc8c7c9a381c8db5a190fae92.png

点这里

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/524681
推荐阅读
相关标签