当前位置:   article > 正文

ChatTTS+Python编程搞定语音报时小程序_chattts python

chattts python

文字转语音神器+Python编程搞定语音报时小程序

今天一个好哥们发了一个文字转语音的AI神器的短视频。这个神器的网站是[ChatTTS - Text-to-Speech for Conversational Scenarios][https://chattts.com/],如下图所示:

Screenshot 2024-05-30 at 19.36.49

Screenshot 2024-05-30 at 19.37.24

这个开源项目可以从github.com上下载,也可以在这个网页下载。如下图所示:

Screenshot 2024-05-30 at 19.41.02

在主页上大概体验了一下,文字转语音还可以,但是有些生字(镇赉县)还是不能正常识别,比方说这个”赉“字。还有就是阿拉伯数字也不能正常识别。但是可以通过程序转成汉字,然后就可以了。言归正传,这个开源项目给我的最好的体会就是免费,于是按照上图所示的步骤,下载了源码并安装了依赖库,强调一下,这个源码运行环境在Anaconda下可以,PyCharm我的电脑不能运行,报错。

我首先想到的是利用这个API编一个语音报时的小程序,之前我编了一个万年历,这回可以实现语音播报了。我首先实现一个简单的报时小程序。

下载之后的源码文件夹拷贝到你指定的目录下面,然后进入Anaconda的Jupyter-Notebook下,打开

上面说到了,阿拉伯数字是不能准确识别的。但是用datetime模块生成的时间或者日期都是阿拉伯数字,必须转成汉字才可以利用这个开源模块实现语音播报。

环境

操作系统:macOS Sonoma

开发环境:Anaconda+Python 3.11

源码如下:

import torch
import ChatTTS
from IPython.display import Audio
import datetime


chat = ChatTTS.Chat()
chat.load_models()

# 定义一个类
class PeriodDay:
    def __init__(self):
        self.now = datetime.datetime.now()

    def get_time_of_day(self):
        if self.now.hour < 12:
            return "上午"
        elif 12 <= self.now.hour < 18:
            return "下午"
        else:
            return "晚上"

    # 定义一个时间转成汉字的函数
    def format_time_final(self):
        hour, minute = self.now.strftime('%H:%M').split(':')
        if int(minute) == 0:
            minute = '整'
        elif int(minute) < 10:
            minute = '零' + number_to_chinese(int(minute)) + '分'
        elif int(minute) < 20:
            minute = number_to_chinese(int(minute))[1:] + '分'
        else:
        	minute = number_to_chinese(int(minute)) + '分'

        if 10 <= int(hour) < 20:
            hour = number_to_chinese(int(hour))[1:] + '时'
            return f'{hour} {minute}'
        else:
            return f'{number_to_chinese(int(hour))[:]}{minute}'

    def get_month_day(self):
        month = number_to_chinese(self.now.month)
        day = number_to_chinese(self.now.day)
        return month, day
    
    # 定义一个返回星期几的函数
    def get_weekday(self):
        date = self.now.strftime('%Y-%m-%d')
        # 将日期转换为datetime对象
        datetime_obj = datetime.datetime.strptime(date, '%Y-%m-%d')

        # 获取星期几的数字(0代表星期日,1代表星期一,...,6代表星期六)
        weekday = datetime_obj.strftime('%w')

        # 将星期几数字转换为中文星期几
        weekdays = ['星期日', '星期一', '星期二', '星期三', '星期四', '星期五', '星期六']
        weekday_cn = weekdays[int(weekday)
        return weekday_cn


# 定义一个数字转成汉字的函数
def number_to_chinese(number):
    units = ['', '十']
    digits = ['零', '一', '二', '三', '四', '五', '六', '七', '八', '九']

    if number == 0:
        return '零'

    result = ''
    digit_count = 0
    last_zero = True

    while number > 0:
        digit = number % 10
        number //= 10

        if digit == 0:
            result = digits[number] + '十'
            break
        if digit != 0:
            if last_zero:
                result = digits[digit] + result
            else:
                result = digits[digit] + units[digit_count] + result
            last_zero = False
        else:
            if not last_zero:
                result = digits[digit] + result
            last_zero = True

        digit_count += 1

    return result


# 实例化一个早中晚的对象
morning_noon_evening = PeriodDay()
# 获取当前的时段
time_of_day = morning_noon_evening.get_time_of_day()

# 利用当前时间提取月,日,时,分
month, day = morning_noon_evening.get_month_day()
# 将时:分转成汉字
text_time = morning_noon_evening.format_time_final()
# 要报时的文字
time_text = f"{time_of_day}好,现在是{month}{day}{week_day}  北京时间{text_time}。在干嘛?"
# 定义一个转成语音的文字列表变量
texts = [time_text]
print(time_text)
# 生成语音
wavs = chat.infer(texts, use_decoder=True)

# 播放语音
Audio(wavs[0], rate=24_000, autoplay=True)

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89
  • 90
  • 91
  • 92
  • 93
  • 94
  • 95
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • 103
  • 104
  • 105
  • 106
  • 107
  • 108
  • 109
  • 110
  • 111
  • 112
  • 113
  • 114
  • 115

运行效果如下:

INFO:ChatTTS.core:All initialized.
下午好,现在是五月三十一日 星期五  北京时间十四时 一十一分。在干嘛?
 10%|████▏                                     | 38/384 [00:00<00:09, 38.29it/s]
 15%|██████                                  | 309/2048 [00:05<00:32, 53.73it/s]
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/743707
推荐阅读
相关标签
  

闽ICP备14008679号