【AI数字人】AniPortrait音频驱动图片数字人本地离线整合包_aniportrait安装

作者：小舞很执着 | 2024-08-05 20:22:39

踩

aniportrait安装

今天分享的项目是由华为和腾讯的研究人员联手开发的AniPortrait，只需一段音频和一个静态的肖像图像，就能生成一段数字人视频。支持音频生成视频、视频生成视频。我已经将项目打包，离线解压即可使用！（整合包在文章末尾自取）

配置要求

暂不支持本地离线版本

可访问在线链接进行体验(需科学上网)

操作方法跟音频生视频类似，上传源视频即可。

需要注意的是，这个项目是有示例的，点击示例会自动配置示例的音频和图片，但是生成示例会很慢！建议用自己的图和音频先试下！

这个项目使用时可能会遇到UTF-8编码问题。

解决方法：

打开控制面板---时钟和区域

点击区域

点击管理

点击更改系统区域设置

勾选这个选项，然后重启电脑即可。

- 使用预训练的wav2vec模型从音频中提取特征，这些特征能够准确识别发音和语调。
- 通过两个全连接层（fc layers），将音频特征转换为3D面部网格。
- 利用transformer解码器，结合交叉注意力机制，预测头部姿态序列。

- 给定参考肖像图像和面部标记序列，Lmk2Video模块创建与标记序列对齐且外观与参考图像一致的时间一致性肖像动画。
- 网络结构设计灵感来源于AnimateAnyone，使用Stable Diffusion 1.5作为基础，整合了时间运动模块。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小舞很执着/article/detail/934082