当前位置:   article > 正文

ChatTTS增强版V3【已开源】,长文本修复,中英混读,导入音色,批量SRT、TXT

chattts增强版

ChatTTS增强版V3来啦!本次更新增加支持导入SRT、导入音色等功能。结合上次大家反馈的问题,修复了长文本、中英混读等问题。

项目已开源(https://github.com/CCmahua/ChatTTS-Enhanced)

项目介绍

V3

ChatTTS增强版V3,长文本修复,中英混读,导入音色,批量SRT、TXT,代码开源_哔哩哔哩_bilibili

V2

ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复_哔哩哔哩_bilibili

V1

ChatTTS增强版整合包,增强音质、批量处理、固定音色、支持长文本(WIN、MAC)_哔哩哔哩_bilibili

更新内容

批量SRT、TXT

批量功能新增支持多个TXT文本或SRT批量导入,会针对每文件进行处理。并支持导出对应SRT。

TXT文本内容格式不用严格按照换行的来。

你可以按照之前换行的格式来。

也可以直接所有内容文本粘进去,会自动根据标点符号进行切分。

长文本

不少朋友反馈上个版本长文本的问题很多,这个版本进行调整。文本内容会自动按照标点符号进行断句。

(音频效果)

英文效果

(音频效果)

中英混读

(效果)

文本选项

删除了之前数字转换选项、合成整个音频的选项。

数字转换已经内置进去,无需手动勾选。合成整个音频默认自动合成。

导出的完整的音频路径为:output_audio/你的txt名/合并/

导出的音频切片路径为:output_audio/你的txt名/切片/

导出的增强音频切片路径为:output_audio/你的txt名/增强切片/

音色选项

新增上传音色功能。

支持导入ChatTTS_Speaker项目的.pt音色文件。

项目地址:

https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker

在该项目上试听音色,下载.pt文件

音色这里把.pt文件上传。

点击生成即可。

配置管理

之前的配置文件格式是.json。这个版本统一保存为.pt格式。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/在线问答5/article/detail/943922
推荐阅读
相关标签