当前位置:   article > 正文

MuseTalk 音频驱动唇形同步_musetalk git下载

musetalk git下载

效果展示

新建虚拟环境

(建议使用 python 版本 >=3.10 和 cuda 版本 =11.7。)

conda create -n musetalk python=3.10

安装pytorch和cuda环境

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

下载项目文件

git clone https://github.com/TMElyralab/MuseTalk.git

下载项目依赖包

pip install -r requirements.txt

mmlab 封装

  1. pip install --no-cache-dir -U openmim
  2. mim install mmengine
  3. mim install "mmcv>=2.0.1"
  4. mim install "mmdet>=3.1.0"
  5. mim install "mmpose>=1.1.0"

下载 ffmpeg-static

  1. # 下载ffmpeg-static版本,这里以ffmpeg 4.4为例(确保使用你的具体版本号)
  2. wget https://johnvansickle.com/ffmpeg/releases/ffmpeg-release-amd64-static.tar.xz
  3. # 解压文件
  4. tar -xvf ffmpeg-release-amd64-static.tar.xz

设置环境变量

  1. 打开一个终端窗口。编辑 .bashrc 
  2. 使用文本编辑器打开你的 .bashrc 文件。大多数Linux用户使用的是 Bash shell,其配置文件通常是 .bashrc。你可以使用 nano 或其他编辑器打开这个文件

    nano ~/.bashrc
    
  3. 添加 export 命令,在打开的文件中,添加以下行:请确保路径与你解压的的目录匹配。

    export FFMPEG_PATH=~/musetalk/ffmpeg-4.4-amd64-static
    

  4. 保存和退出编辑器,按 Ctrl+O 保存文件更改,然后按 Ctrl+X 退出 nano 编辑器。

  5. 更新环境变量,为使更改生效,需要重新加载 .bashrc.bash_profile。在你的终端中,执行以下命令:

    source ~/.bashrc
    
  6. 验证安装:验证 ffmpeg 是否正确安装和配置:

    $FFMPEG_PATH/ffmpeg -version
    
可能会遇到ffmpeg 模块缺少预期的 input 方法和 Error 类,这通常发生在你安装了一个与预期不符的 ffmpeg 包时。

在终端执行以下命令查看已安装的相关库:

pip list | grep ffmpeg

 安装正确的库:

pip install ffmpeg-python 

下载权重

Download weights

TMElyralab/MuseTalk:MuseTalk:具有潜在空间修复的实时高质量唇形同步 (github.com)icon-default.png?t=N7T8https://github.com/TMElyralab/MuseTalk?tab=readme-ov-file

最后,这些权重应按如下方式组织:models

  1. ./models/
  2. ├── musetalk
  3. │ └── musetalk.json
  4. │ └── pytorch_model.bin
  5. ├── dwpose
  6. │ └── dw-ll_ucoco_384.pth
  7. ├── face-parse-bisent
  8. │ ├── 79999_iter.pth
  9. │ └── resnet18-5c106cde.pth
  10. ├── sd-vae-ft-mse
  11. │ ├── config.json
  12. │ └── diffusion_pytorch_model.bin
  13. └── whisper
  14. └── tiny.pt

 模型推理

python -m scripts.inference --inference_config configs/inference/test.yaml 

 configs/inference/test.yaml 是推理配置文件的路径,包括 video_path 和 audio_path。 video_path应为视频文件或图像目录。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/594633
推荐阅读
相关标签
  

闽ICP备14008679号