赞
踩
代码下载:GitHub - 2noise/ChatTTS: A generative speech model for daily dialogue.
【我的代码下载的是2024-06-19的#365版本】
模型下载:https://huggingface.co/2Noise/ChatTTS/tree/main
运行环境win11,python3.10,vscode
用vscode打开下载好的TTS,执行
pip install -r requirements.txt
问题:
安装vs_BuildTools后解决
2. 出现:“cl: 命令行 error D8021 :无效的数值参数“/Wno-register”
安装conda解决
- # 创建环境
- conda create -n tts python=3.10
-
- # 激活环境
- conda activate tts
-
- # 安装
- conda install -c conda-forge pynini=2.1.5
-
- # 去掉requirements.txt中的pynini==2.1.5安装
- pip install -r requirements.txt
-
官方的和网上教程差不多都过时了,直接运行不了的。可能是我的问题
打开webui.py文件修改,default是下载模型的位置,compile在Linux下可以不用设置,我的Windows11是需要改成false的,不然报错。修改后运行即可
- import ChatTTS
- import torch
- import torchaudio
-
- # 本地模型位置
- MODEL_PATH = r'D:\LLM_MODEL\chat_tts'
-
- # 初始化并加载模型,
- chat = ChatTTS.Chat()
- chat.load_models('local', local_path=MODEL_PATH,compile=False)
-
- # 需要转化为音频的文本内容
- text = '四川美食确实以辣闻名,但也有不辣的选择。比如甜水面、赖汤圆、蛋烘糕、叶儿粑等,这些小吃口味温和,甜而不腻,也很受欢迎。'
-
- # 文本转为音频
- wavs = chat.infer(text, use_decoder=True)
-
- audio_path = r'D:\vs_work\ChatTTS\output1.wav'
-
- # 保存音频文件到本地文件(采样率为24000Hz)
- torchaudio.save(audio_path, torch.from_numpy(wavs[0]), 24000)
-
- # 加载音频文件
- from pydub import AudioSegment
- from pydub.playback import play
-
- song = AudioSegment.from_wav(audio_path)
- play(song)

问题:
pip install pysoundfile
配置环境变量,验证:ffmpeg -version
3. 出现 :PermissionError: [Errno 13] Permission denied: 'C:\\Users\\weime\\AppData\\Local\\Temp\\tmprl_oisrh.wav'
这个问题尝试了很多种解决方式,最终成功的:
# 安装pydub pip install pydub修改代码:加入delete=False,在play()的方法中。出处:pydub.playback.play(),‘PermissionError: [Errno 13] Permission denied’ · Issue #690 · jiaaro/pydub · GitHub
执行代码,可以听到声音了
=====================================================================
记录一下其他的未成功的方法:
1.安装simpleaudio,需要C++14【我用conda安装成功后,就把C++14给卸载了】
2.安装pyaudio,可以成功播放,但是声音变成电磁波那种的了
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。