chat TTS【2024-06-19版本】安装及问题

作者：天景科技苑 | 2024-06-27 02:41:14

踩

代码下载：GitHub - 2noise/ChatTTS: A generative speech model for daily dialogue.

【我的代码下载的是2024-06-19的#365版本】

模型下载：https://huggingface.co/2Noise/ChatTTS/tree/main

运行环境win11，python3.10，vscode

1.安装

用vscode打开下载好的TTS，执行

pip install -r requirements.txt

问题：

出现："Microsoft Visual C++ 14.0 is required"

安装vs_BuildTools后解决

2. 出现：“cl: 命令行 error D8021 :无效的数值参数“/Wno-register”

安装conda解决


# 创建环境
conda create -n tts python=3.10
 
# 激活环境
conda activate tts 
 
# 安装
conda install -c conda-forge pynini=2.1.5 
 
# 去掉requirements.txt中的pynini==2.1.5安装
pip install -r requirements.txt

2.运行

官方的和网上教程差不多都过时了，直接运行不了的。可能是我的问题

打开webui.py文件修改，default是下载模型的位置，compile在Linux下可以不用设置，我的Windows11是需要改成false的，不然报错。修改后运行即可

3结果

4后台自动播放生成音频


import ChatTTS
import torch
import torchaudio
 
# 本地模型位置
MODEL_PATH = r'D:\LLM_MODEL\chat_tts'
 
# 初始化并加载模型，
chat = ChatTTS.Chat()
chat.load_models('local', local_path=MODEL_PATH,compile=False)
 
# 需要转化为音频的文本内容
text = '四川美食确实以辣闻名，但也有不辣的选择。比如甜水面、赖汤圆、蛋烘糕、叶儿粑等，这些小吃口味温和，甜而不腻，也很受欢迎。'
 
# 文本转为音频
wavs = chat.infer(text, use_decoder=True)
 
audio_path = r'D:\vs_work\ChatTTS\output1.wav'
 
# 保存音频文件到本地文件（采样率为24000Hz）
torchaudio.save(audio_path, torch.from_numpy(wavs[0]), 24000)
 
# 加载音频文件
from pydub import AudioSegment
from pydub.playback import play
 
song = AudioSegment.from_wav(audio_path)
play(song)

问题：

出现：RuntimeError: Couldn't find appropriate backend to handle uri output1.wav and format None.
安装
```
pip install pysoundfile
```
出现：缺少“ffmpeg”

安装Download FFmpeg

配置环境变量，验证：ffmpeg -version

3. 出现：PermissionError: [Errno 13] Permission denied: 'C:\\Users\\weime\\AppData\\Local\\Temp\\tmprl_oisrh.wav'

这个问题尝试了很多种解决方式，最终成功的：
# 安装pydub
pip install pydub
修改代码：加入delete=False，在play()的方法中。出处：pydub.playback.play(),‘PermissionError: [Errno 13] Permission denied’ · Issue #690 · jiaaro/pydub · GitHub

执行代码，可以听到声音了

=====================================================================

记录一下其他的未成功的方法：

1.安装simpleaudio，需要C++14【我用conda安装成功后，就把C++14给卸载了】

2.安装pyaudio，可以成功播放，但是声音变成电磁波那种的了

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/天景科技苑/article/detail/761046