Comfyui-ChatTTS-OpenVoice 为ComfyUI添加语音合成、语音克隆功能

作者：煮酒与君饮 | 2024-06-30 18:36:09

踩

chattts comfyui

‍‍

生成多人播客：

Comfyui-ChatTTS是一个开源的GitHub项目，致力于为ComfyUI添加语音合成功能。该项目提供了一系列功能强大的节点和模型，支持用户创建和复用音色，支持多人对话模式的生成，并提供了导出音频字幕文件的功能。

项目包含多个关键节点，如ChatTTS、Multi Person Podcast、CreateSpeakers，以及SaveSpeaker和LoadSpeaker，后者使得音色的保存和加载变得非常方便。用户可以通过这些节点生成多角色的对话音频，并在需要时复用先前创建的音色。此外，项目还提供了Load Whisper Model和Whisper Transcribe节点，这些节点可以方便地将音频文件转录为字幕文本文件。

一个显著的特点是项目支持OpenVoiceClone节点，这使得音色迁移更加容易，从而更好地控制角色的声音。用户可以通过加载不同的模型和音色文件，实现对角色声音的精细控制。

模型文件可以从Hugging Face平台下载并放置在指定的文件夹中，如models/chat_tts、models/chat_tts_speaker、models/open_voice和models/whisper/large-v3。

项目还包含一个课程示例代码，以ChatTTS为例，展示了如何为ComfyUI增加语音合成功能。这个示例代码详细介绍了自定义节点的实现方法，包括后端Python代码的编写和节点界面的修改。

通过该项目，用户可以在ComfyUI中实现复杂的语音合成任务，创建个性化的音色和对话模式，并且能够方便地导出音频和字幕文件。项目的开放性和强大的功能使其成为语音合成领域的一个重要工具。

https://github.com/shadowcz007/Comfyui-ChatTTS

备注：comfyui

‍

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/煮酒与君饮/article/detail/773599