赞
踩
西安交通大学开源了人工智能SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以实现图片+音频就能生成高质量的视频。内含多个踩坑的解决办法,值得玩一玩。
1、sadtalker安装
1.1 windows运行环境构建
Install Python 3.10.6
Install git manually
Install ffmpeg
Download our SadTalker repository, git clone https://github.com/Winfredy/SadTalker.git.
Download the checkpoint and gfpgan below,放当前目录checkpoint下;
Run start.bat from Windows Explorer as normal, non-administrator, user, a gradio WebUI demo will be started.
1.2、Linux安装,推荐,我就是用的这个环境
Installing anaconda, python and git.
去下载:https://www.anaconda.com/download#downloads
# 进入当保存文件的目录,执行此指令, 后期由于版本更新,可能会与此文件命名有所不同
bash Anaconda3-2023.03-1-Linux-x86_64.sh -p /home/program/anaconda3
source ~/.bashrc
安装
git
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。