当前位置:   article > 正文

ChatTTS完美部署

ChatTTS完美部署

一、项目工程下载

2noise/ChatTTS: ChatTTS is a generative speech model for daily dialogue. (github.com)

直接git clone即可!(直接down包,解压)

二、模型下载

测试了两种,直接编写代码下载即可!最简单方便。

  1. #SDK模型下载
  2. from modelscope import snapshot_download
  3. model_dir = snapshot_download('pzc163/chatTTS')

不写绝对路径就会保存在这个位置

C:\Users\Administrator\.cache\modelscope\hub\pzc163

下载完之后移动到自己的工程下,目录如下:

三、环境安装

需要安装下面的库

  1. omegaconf~=2.3.0
  2. torch~=2.1.0
  3. tqdm
  4. einops
  5. vector_quantize_pytorch
  6. transformers~=4.41.1
  7. vocos

如果是新的环境,就直接全部安装,如果本身有一些库就自行pip install就可以。

全部安装运行:

pip install -r requirements.txt

四、运行Demo.py并保存结果

  1. import scipy
  2. import ChatTTS
  3. from IPython.display import Audio
  4. chat = ChatTTS.Chat()
  5. chat.load_models(source='local', local_path='ChatTTS')
  6. params_infer_code = {'prompt':'[speed_5]', 'temperature':.3}
  7. params_refine_text = {'prompt':'[oral_2][laugh_0][break_6]'}
  8. texts = ["四川美食可多了,[uv_break] 有麻辣火锅、宫保鸡丁、麻婆豆腐、[uv_break] 担担面、回锅肉、夫妻肺片等, [uv_break] 每样都让人垂涎三尺。"]
  9. wav = chat.infer(texts, \
  10. params_refine_text=params_refine_text, params_infer_code=params_infer_code)
  11. #texts = ["This is a test of the ChatTTS script. Peter Piper picked a peck of pickled peppers. Red leather. Yellow leather. Red leather. Yellow leather. Red leather. Yellow leather.",]
  12. # wavs = chat.infer(texts, use_decoder=True)
  13. Audio(wav[0], rate=24_000, autoplay=True)
  14. scipy.io.wavfile.write(filename = "output.wav", rate = 24_000, data = wav[0].T)

五、报错情况

windows会报错,需要改ChatTTS/core.py,第75行。

compile: bool = False,

结语:以上内容仅供学习使用!!!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/676927
推荐阅读
相关标签
  

闽ICP备14008679号