DDSP2推理以及训练_dddsp配置文件

作者：从前慢现在也慢 | 2024-03-20 22:51:01

踩

dddsp配置文件

首先需要下载本项目所需要的基本环境，一个是DDSP2的项目本身，链接如下

https://pan.baidu.com/s/1zwGpOHaZciTrdcCIBJD0lQ?pwd=INT4

然后是FFmpeg，链接如下

这里需要注意的是，你要下载的是后缀为win64-gpl的那一个压缩包，下下来以后，将你的bin文件夹加入系统环境中，听我说你们也不知道怎么弄，直接看我的截图

按照上面的操作一步一步来即可，环境设置完毕以后，把本项目解压，然后直接点击“启动训练推理webui”一键启动就可以了，第一次启动可能会有点慢，耐心等待一会，启动以后，界面如下

这个包里面有一个预置的权重，在exp文件夹里，我们可以先拿到一段语音文件，先试一下效果如何，这里需要注意的是，这个文件无论是训练，还是推理，都只支持wav的文件格式，但是我们大部分手机或者其他录音出来的格式都不是wav格式，所以需要一个转格式的网站，链接如下

我们只需要上传我们要转的文件，然后选择wav格式，就可以了，操作如下

转换完毕以后，直接下载即可

拿到wav文件以后，直接拖到那个输入文件的地方，然后点击转换即可，具体操作如下

这里的变调，说话人id等都可以先随便设置，我们只是在测试环境搭建的结果的，如果这一步没有问题的话，我们再执行下一步。

关于DDSP2的训练，大家需要注意，这个训练还是很吃设备的，前期建议大家尽量要拿到单人的，干净的人声来训练，才会有一个比较好的效果，这里一个小技巧分享给大家

通过这个网站可以把b站的视频下载下来，然后在通过上面那个网站就可以把mp4文件转换成wav文件，从而拿到干净的人声

拿到人声以后，将wav文件放在\DDSP\DDSP-SVC\data\train\audio这个地址下，再放10个验证wav文件在\DDSP\DDSP-SVC\data这个地址下，然后直接训练即可，具体操作看下图

记住，打开数据集文件夹以后，把你要训练的文件放完，然后再点击开始预处理，预处理完了以后，直接点击训练即可。

后面还有可以使用实时变声器的，这个就留着大家自己探索了，在文章的最后，需要提醒大家，本次教程仅限于技术分享，如果大家要拿着这个教程去做一些违反道德的事情，我首先切割，然后第一个举报你，希望大家都是抱着学习的心态来看教程的。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/276515