当前位置:   article > 正文

Github:ChatTTS从下载到使用

chattts

前言

  • 本文使用工具:
    • Anaconda :直接进行包管理,用来自定义生成python解释器,虚拟环境
    • vscode:用来执行代码

注:我使用的Ubuntu,使用win,mac等,需要额外配置


简介

ChatTTS是专门为对话场景设计的文本转语音模型,bilibili宣传视频
项目地址

安装

1. 创建虚拟环境并激活:

conda create -n chattts_env python=3.11
conda activate chattts_env
  • 1
  • 2

2. 克隆项目并安装依赖:

git clone https://github.com/2noise/ChatTTS.git
cd ChatTTS
pip install -r requirements.txt
  • 1
  • 2
  • 3

3. 文章目录结构

├── ChatTTS
│   ├── core.py
│   ├── experimental
│   │   └── llm.py
│   ├── infer
│   │   └── api.py
│   ├── __init__.py
│   ├── model
│   │   ├── dvae.py
│   │   └── gpt.py
│   └── utils
│       ├── gpu_utils.py
│       ├── infer_utils.py
│       └── io_utils.py
├── example.ipynb
├── LICENSE
├── README_CN.md
├── README.md
├── requirements.txt
└── webui.py
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

使用

  • 输入code . 用打开vscode,启动webui.py

在这里插入图片描述


问题

Q:安装依赖过程中遇到了下载CUDA组件错误

A:因为代码需要使用到pytorch框架,所以可以看我的这篇文章手动配置CUDA组件https://blog.csdn.net/unravel_tom/article/details/139197086主要是用win来配置的

ubuntu就可以使用以下命令直接配置

conda install -c conda-forge cudatoolkit=12.1 cudnn=8.9
  • 1

Q:缺少常见的依赖

A:

pip install gradio
pip install WeTextProcessing
  • 1
  • 2

Gradio 是一个非常有用的工具,用于创建交互式的机器学习应用界面。它允许用户通过简单的代码快速搭建网络界面,方便展示和测试模型。它支持多种输入和输出类型,包括文本、图像、音频等,且易于集成和部署。

WeTextProcessing 是一个用于文本处理的库,包含多种文本预处理和特征提取工具。这些工具包括分词、词性标注、命名实体识别、情感分析等,帮助开发者在自然语言处理(NLP)任务中更高效地处理和分析文本数据。它支持多种语言,易于集成到现有的NLP工作流中,是开发和研究文本处理应用的有力工具。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/665112
推荐阅读
相关标签
  

闽ICP备14008679号