赞
踩
今天一个好哥们发了一个文字转语音的AI神器的短视频。这个神器的网站是[ChatTTS - Text-to-Speech for Conversational Scenarios][https://chattts.com/],如下图所示:
这个开源项目可以从github.com上下载,也可以在这个网页下载。如下图所示:
在主页上大概体验了一下,文字转语音还可以,但是有些生字(镇赉县)还是不能正常识别,比方说这个”赉“字。还有就是阿拉伯数字也不能正常识别。但是可以通过程序转成汉字,然后就可以了。言归正传,这个开源项目给我的最好的体会就是免费,于是按照上图所示的步骤,下载了源码并安装了依赖库,强调一下,这个源码运行环境在Anaconda下可以,PyCharm我的电脑不能运行,报错。
我首先想到的是利用这个API编一个语音报时的小程序,之前我编了一个万年历,这回可以实现语音播报了。我首先实现一个简单的报时小程序。
下载之后的源码文件夹拷贝到你指定的目录下面,然后进入Anaconda的Jupyter-Notebook下,打开
上面说到了,阿拉伯数字是不能准确识别的。但是用datetime模块生成的时间或者日期都是阿拉伯数字,必须转成汉字才可以利用这个开源模块实现语音播报。
环境
操作系统:macOS Sonoma
开发环境:Anaconda+Python 3.11
源码如下:
import torch import ChatTTS from IPython.display import Audio import datetime chat = ChatTTS.Chat() chat.load_models() # 定义一个类 class PeriodDay: def __init__(self): self.now = datetime.datetime.now() def get_time_of_day(self): if self.now.hour < 12: return "上午" elif 12 <= self.now.hour < 18: return "下午" else: return "晚上" # 定义一个时间转成汉字的函数 def format_time_final(self): hour, minute = self.now.strftime('%H:%M').split(':') if int(minute) == 0: minute = '整' elif int(minute) < 10: minute = '零' + number_to_chinese(int(minute)) + '分' elif int(minute) < 20: minute = number_to_chinese(int(minute))[1:] + '分' else: minute = number_to_chinese(int(minute)) + '分' if 10 <= int(hour) < 20: hour = number_to_chinese(int(hour))[1:] + '时' return f'{hour} {minute}' else: return f'{number_to_chinese(int(hour))[:]}时 {minute}' def get_month_day(self): month = number_to_chinese(self.now.month) day = number_to_chinese(self.now.day) return month, day # 定义一个返回星期几的函数 def get_weekday(self): date = self.now.strftime('%Y-%m-%d') # 将日期转换为datetime对象 datetime_obj = datetime.datetime.strptime(date, '%Y-%m-%d') # 获取星期几的数字(0代表星期日,1代表星期一,...,6代表星期六) weekday = datetime_obj.strftime('%w') # 将星期几数字转换为中文星期几 weekdays = ['星期日', '星期一', '星期二', '星期三', '星期四', '星期五', '星期六'] weekday_cn = weekdays[int(weekday) return weekday_cn # 定义一个数字转成汉字的函数 def number_to_chinese(number): units = ['', '十'] digits = ['零', '一', '二', '三', '四', '五', '六', '七', '八', '九'] if number == 0: return '零' result = '' digit_count = 0 last_zero = True while number > 0: digit = number % 10 number //= 10 if digit == 0: result = digits[number] + '十' break if digit != 0: if last_zero: result = digits[digit] + result else: result = digits[digit] + units[digit_count] + result last_zero = False else: if not last_zero: result = digits[digit] + result last_zero = True digit_count += 1 return result # 实例化一个早中晚的对象 morning_noon_evening = PeriodDay() # 获取当前的时段 time_of_day = morning_noon_evening.get_time_of_day() # 利用当前时间提取月,日,时,分 month, day = morning_noon_evening.get_month_day() # 将时:分转成汉字 text_time = morning_noon_evening.format_time_final() # 要报时的文字 time_text = f"{time_of_day}好,现在是{month}月{day}日 {week_day} 北京时间{text_time}。在干嘛?" # 定义一个转成语音的文字列表变量 texts = [time_text] print(time_text) # 生成语音 wavs = chat.infer(texts, use_decoder=True) # 播放语音 Audio(wavs[0], rate=24_000, autoplay=True)
运行效果如下:
INFO:ChatTTS.core:All initialized.
下午好,现在是五月三十一日 星期五 北京时间十四时 一十一分。在干嘛?
10%|████▏ | 38/384 [00:00<00:09, 38.29it/s]
15%|██████ | 309/2048 [00:05<00:32, 53.73it/s]
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。