赞
踩
EchoMimic更新啦,我24号刚出的一篇,到了25号官方就更新了新的加速模型。
着实没赶上官方更新的速度......
那本次我主要讲下更新了什么内容,如何修改使用acc加速模型。
另外还准备了v2版本的整合包!大家可以体验下!
那先来看下本次更新的内容:
Audio Driven加速模型及管道发布,推理速度提升10 倍(V100 GPU 上从 ~7mins/240frames 提升至 ~50s/240frames)
简单来说就是更新了新的加速模型,比上个版本的速度提升了不少(官方说是10倍)。
实际测试下来,之前同样的素材,(4090)未加速的话6steps是要2分钟左右,加速后的只需要30多秒左右,提升确实很大。
虽说官方更新了加速模型和相关示例代码,但是webgui脚本还是2周前的,新版本使用还是会报错。
然后看到GitHub上有很多小伙伴也都遇到了这个问题
这里说下解决方法,来到webgui.py脚本下
process_video
函数下:
- face_img,crop_rect = crop_and_pad(face_img, crop_rect)
- face_mask,crop_rect = crop_and_pad(face_mask, crop_rect)
修改为
- face_img,_ = crop_and_pad(face_img, crop_rect)
- face_mask,_ = crop_and_pad(face_mask, crop_rect)
脚本导入模块这里
from src.pipelines.pipeline_echo_mimic import Audio2VideoPipeline
修改为
from src.pipelines.pipeline_echo_mimic_acc import Audio2VideoPipeline
config_path这里
config_path = "./configs/prompts/animation.yaml"
修改为
config_path = "./configs/prompts/animation_acc.yaml"
修改完以上内容后,启动webgui.py
就可以正常使用加速模型啦!
当然如果你不想修改也可以直接下载好我制作的整合包
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。