赞
踩
使用Gradio + TTS 生成文本转语音工具,TTS生成的.wav
文件存储在本地,然后通过librosa工具读取文件并返回给Gradio。
尝试了很多个语音工具,只有librosa返回的数据格式能够很好地与Gradio兼容。
librosa.load()
返回:data:音频时间序列 sr :音频的采样率
https://librosa.org/doc/latest/tutorial.html
import gradio as gr from TTS.api import TTS import librosa title = "文本转语音" def generateAudio(text): #由于TTS无法很好地处理回车符和空格,需要对text里的回车符进行替换 text = text.replace("\n",",") text = text.replace(" ","") tts = TTS(model_name="tts_models/zh-CN/baker/tacotron2-DDC-GST", progress_bar=True, gpu=False) tts.tts_to_file(text,file_path="output.wav") audio, sr = librosa.load(path="output.wav") return sr,audio app = gr.Interface( fn=generateAudio, inputs="text", outputs="audio", title=title, examples=[os.path.join(os.path.dirname(__file__),"output.wav")] ) app.launch()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。