当前位置:   article > 正文

一个AI实时变声工具

ai变声吃什么配置

 一个基于VITS的简单易用的语音转换(变声器)框架。

配置要求
1 win10或win11系统,老显卡驱动要更新到最新版本
2 显卡750TI以上,如需训练音源,需RTX以上显卡,显存越大越好
3 CPU支持AVX2指令集,性能越高越推理延迟越低,建议十代酷睿或三代锐龙以上
4 清晰干净的麦克风,声卡麦克风最优

界面预览

290940ac6425d3229a03ef143ca0d553.png

测试效果如下:

测试下来对麦克风的要求很高,我用的蓝牙耳机,导致噪音比较大,声音也不是很清晰,如果声音出现断续的情况,可以更改延迟采样的时间。

1 AI变声不吃个人声线,只需要清晰的说化即可,传统变声器只能根据个人声线进行变化
2 可以训练模型,加载各种声线,语气声线多样化
相比于传统变声器缺点
1 延迟太高,通常都是1-5秒以上,传统变声器最低可以无延迟
2 咬字不清晰,气息非常奇怪,感情波动就会失真,非常吃模型的音源
3 吃配置较高,需要CPU和GPU双重占用,配置低就无法使用,大多目前只能兼容N卡
4 兼容性还是太差了,AI变声目前还不成熟,闪退稳定性有待优化

想尝试的朋友可以点下关注,后台回复RVC获取下载链接

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/354872
推荐阅读
相关标签
  

闽ICP备14008679号