一键音频驱动图片数字人项目——EchoMimic(附整合包)

作者：你好赵伟 | 2024-08-11 08:41:02

踩

echomimic

大家好，今天要给大家带来一个数字人相关项目——EchoMimic。该项目是由蚂蚁集团支付宝终端技术部出品，只需要一段音频和一个参考图片，EchoMimic就能让图片中的人物“活”起来。

我已制作好一键启动整合包和云端一键部署镜像方便大家快速上手体验！

效果展示

EchoMimic支持中文、英文音频驱动。

中文测试的效果

英文测试的效果

使用方法

1. 解压压缩包：注意路径避免使用中文等特殊符号。推荐使用第三方解压软件如Bandizip，以确保正确解压。

2.打开启动器：耐心等待片刻，系统将自动跳转到网页界面。

上传一张参考图像，注意人物面部清晰，尽量不要有遮挡。

输入参考音频。

一般到这里就可以直接点击生成啦。

追求细节和完美可以继续调整更多参数。

调整配置参数：如宽度、高度、长度、种子参数等。

如果你发现生成的面部有些偏移，可以调节“⾯部掩膜膨胀⽐例”、“⾯部裁剪膨胀⽐例”这两个参数使之更自然流畅：

帧率选择：默认为24帧视频，可以根据自己电脑配置选择更高帧率

设备默认使用的是cuda(显卡)。可以尝试cpu(会非常慢.....)

该项目非常依赖GPU的算力，暂不支持本地离线版本。

可访问云端镜像

https://www.xiangongyun.com/image/detail/0597d2b7-4f15-47f3-b49e-1f5f7260f14c?r=2UKFZQ

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/你好赵伟/article/detail/963233