Pyttsx3+Windows语音合成不同的声音_python espeak-ng

作者：知新_RL | 2024-02-15 23:23:46

踩

python espeak-ng

"""
# ********************************************************************************
#           python如何实现文字转语音，并且解决发声生硬的问题。  # **********************************************************************************
"""

# 在Python中，你可以使用不同的库来实现文字转语音的功能。以下是一些常用的库：
#
#   * `pyttsx3`：这是一个Python语音合成库，可以将文本转换为语音。
#   * `gTTS`：这是一个Google Text-to-Speech API的Python客户端，可以将文本转换为语音。
#   * `espeak`：这是一个开源的语音合成引擎，可以将文本转换为语音。
#
#
# 这些库都可以帮助你实现文字转语音的功能，但是它们的发音效果可能会有所不同。如果你想要解决发声生硬的问题，你可以尝试以下方法：
#
#   * 使用不同的语音合成引擎：不同的语音合成引擎可能会有不同的发音效果，你可以尝试使用不同的引擎来找到最适合你的发音效果。
#   * 调整语音合成引擎的参数：许多语音合成引擎都提供了参数调整的功能，你可以尝试调整这些参数来改善发音效果。
#   * 使用不同的语音合成库：不同的语音合成库可能会有不同的发音效果，你可以尝试使用不同的库来找到最适合你的发音效果。


如何支持多国语言：
首先windows先添加语音，方法如下：
电脑系统图标键，找到windows设置，或者设置， --时间与语言---点击添加语音--管理语言---添加语音 
 
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-CN_HUIHUI_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-GB_HAZEL_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_DAVID_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_EN-US_ZIRA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ES-ES_HELENA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ES-MX_SABINA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_FR-FR_HORTENSE_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_IT-IT_ELSA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_JA-JP_HARUKA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_KO-KR_HEAMI_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_PL-PL_PAULINA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_PT-BR_MARIA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_RU-RU_IRINA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_DE-DE_HEDDA_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-HK_TRACY_11.0
# ------------------------------ HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_ZH-TW_HANHAN_11.0
 
"""


 
 
 
"""
 
# *************************************************************************************************************
#                     python如何实现文字转语音，并且解决发声生硬的问题。                                       *********
# *************************************************************************************************************
 
"""
 
# 在Python中，你可以使用不同的库来实现文字转语音的功能。以下是一些常用的库：
#
#   * `pyttsx3`：这是一个Python语音合成库，可以将文本转换为语音。
#   * `gTTS`：这是一个Google Text-to-Speech API的Python客户端，可以将文本转换为语音。
#   * `espeak`：这是一个开源的语音合成引擎，可以将文本转换为语音。
#
#
# 这些库都可以帮助你实现文字转语音的功能，但是它们的发音效果可能会有所不同。如果你想要解决发声生硬的问题，你可以尝试以下方法：
#
#   * 使用不同的语音合成引擎：不同的语音合成引擎可能会有不同的发音效果，你可以尝试使用不同的引擎来找到最适合你的发音效果。
#   * 调整语音合成引擎的参数：许多语音合成引擎都提供了参数调整的功能，你可以尝试调整这些参数来改善发音效果。
#   * 使用不同的语音合成库：不同的语音合成库可能会有不同的发音效果，你可以尝试使用不同的库来找到最适合你的发音效果。
"""
 
# *************************************************************************************************************
#                     python      pyttsx3语音合成 pyttsx3如何让发音显得更自然一点，默认的有一些僵硬。            *********
# *************************************************************************************************************
"""
 
# 在`pyttsx3`库中，你可以使用`setProperty`方法来设置语音合成引擎的参数，包括语速、音调和音量等。以下是一些常用的方法：
#
#   * `setProperty(name, value)`：设置语音合成引擎的参数。`name`是参数的名称，`value`是参数的值。
#   * `setProperty('rate', rate)`：设置语音合成引擎的语速。`rate`是语速的值，范围是0.0到10.0，其中0.0表示最慢，10.0表示最快。
#   * `setProperty('volume', volume)`：设置语音合成引擎的音量。`volume`是音量的值，范围是0.0到1.0，其中0.0表示无声，1.0表示最大音量。
#   * `setProperty('pitch', pitch)`：设置语音合成引擎的音调。`pitch`是音调的值，范围是0.0到1.0，其中0.0表示最低音调，1.0表示最高音调。
#
# 你可以使用这些方法来设置语音合成引擎的参数，以改善发音效果。例如，你可以使用以下代码来设置语音合成引擎的语速为1.0（正常语速），音量为1.0（最大音量），音调为1.0（最高音调）：
#
# ```python
# import pyttsx3
#
# engine = pyttsx3.init()
# engine.setProperty('rate', 1.0)
# engine.setProperty('volume', 1.0)
# engine.setProperty('pitch', 1.0)
# engine.say('Hello, world!')
# engine.runAndWait()
# ```
#
# 在这个例子中，我们使用`setProperty`方法将语音合成引擎的语速、音量和音调设置为正常值，然后将文本'Hello, world!'转换为语音，并播放出来。
#
# 你也可以尝试调整这些参数的值，以找到最适合你的发音效果。
# 例如，你可以尝试将语速设置为0.5（慢速），音量设置为0.5（小音量），音调设置为0.5（低音调），以使发音显得更自然。
"""
# *************************************************************************************************************
#                     python      pyttsx3 保存为文件                       。            *********
# *************************************************************************************************************
"""
# 在`pyttsx3`库中，你可以使用`saveToWaveFile`方法将语音保存为WAV文件。以下是一个例子：
#
# ```python
# import pyttsx3
#
# engine = pyttsx3.init()
# engine.setProperty('rate', 1.0)
# engine.setProperty('volume', 1.0)
# engine.setProperty('pitch', 1.0)
#
# text = 'Hello, world!'
# engine.say(text)
# engine.runAndWait()
#
# engine.saveToWaveFile('output.wav')
# ```
#
# 在这个例子中，我们首先使用`init`方法初始化语音合成引擎，然后使用`setProperty`方法将语速、音量和音调设置为正常值。然后，我们使用`say`方法将文本转换为语音，并使用`runAndWait`方法播放出来。最后，我们使用`saveToWaveFile`方法将语音保存为名为`output.wav`的WAV文件。
#
# 注意，你需要将`output.wav`替换为你想要保存的文件的路径和名称。
"""
 
# *************************************************************************************************************
#                     python      使用pydub库将wave文件转换为mp3文件                      。            *********
# *************************************************************************************************************
"""
# # 使用pydub库将wave文件转换为mp3文件
# audio = AudioSegment.from_wav('output.wav')
# audio.export('output.mp3', format='mp3')
"""
# *************************************************************************************************************
#                     python     # 设置发音人（这里设置为电脑默认发音人）                      。            *********
voices如下，可以选择自己喜欢的声音。
com.apple.speech.synthesis.voice.Alex
com.apple.speech.synthesis.voice.alice.premium
com.apple.speech.synthesis.voice.alva
com.apple.speech.synthesis.voice.amelie
com.apple.speech.synthesis.voice.anna
com.apple.speech.synthesis.voice.carmit
com.apple.speech.synthesis.voice.damayanti
com.apple.speech.synthesis.voice.daniel
com.apple.speech.synthesis.voice.diego
com.apple.speech.synthesis.voice.ellen
com.apple.speech.synthesis.voice.fiona
com.apple.speech.synthesis.voice.Fred
com.apple.speech.synthesis.voice.ioana
com.apple.speech.synthesis.voice.joana
com.apple.speech.synthesis.voice.jorge
com.apple.speech.synthesis.voice.juan
com.apple.speech.synthesis.voice.kanya
com.apple.speech.synthesis.voice.karen
com.apple.speech.synthesis.voice.kyoko
com.apple.speech.synthesis.voice.laura
com.apple.speech.synthesis.voice.lekha
com.apple.speech.synthesis.voice.luca
com.apple.speech.synthesis.voice.luciana
com.apple.speech.synthesis.voice.maged
com.apple.speech.synthesis.voice.mariska
com.apple.speech.synthesis.voice.meijia
com.apple.speech.synthesis.voice.melina
com.apple.speech.synthesis.voice.milena
com.apple.speech.synthesis.voice.moira
com.apple.speech.synthesis.voice.monica
com.apple.speech.synthesis.voice.nora
com.apple.speech.synthesis.voice.paulina
com.apple.speech.synthesis.voice.rishi
com.apple.speech.synthesis.voice.samantha
com.apple.speech.synthesis.voice.sara
com.apple.speech.synthesis.voice.satu
com.apple.speech.synthesis.voice.sinji
com.apple.speech.synthesis.voice.tessa
com.apple.speech.synthesis.voice.thomas
com.apple.speech.synthesis.voice.tingting.premium
com.apple.speech.synthesis.voice.veena
com.apple.speech.synthesis.voice.Victoria
com.apple.speech.synthesis.voice.xander
com.apple.speech.synthesis.voice.yelda
com.apple.speech.synthesis.voice.yuna
com.apple.speech.synthesis.voice.yuri
com.apple.speech.synthesis.voice.zosia
com.apple.speech.synthesis.voice.zuzana
pyttsx3支持多种语音合成引擎，包括：
MAC    com.apple.speech.synthesis.voice.Alex
WINDOWS   Microsoft Speech API（SAPI） /Microsoft David Desktop (TTS Engine)
Google Text-to-Speech
Amazon Polly
espeak-ng    pip install espeak-ng
eSpeak
Festival
MaryTTS
Pico TTS
MyTTS
iFLYTEK TTS
其中，Microsoft Speech API是Windows系统默认的语音合成引擎，
而Google Text-to-Speech和Amazon Polly需要联网才能使用。其他语音合成引擎可能需要安装额外的库或软件。
如：
From source：
$ git clone https://github.com/TensorSpeech/TensorFlowTTS.git
$ cd TensorFlowTTS
$ pip install .
If you want to upgrade the repository and its dependencies:
$ git pull
$ pip install --upgrade .
# *************************************************************************************************************
"""
# 这段代码是使用Python的pyttsx3库来设置发音人的。在这个例子中，发音人被设置为电脑默认的Alex。
# 这个设置会告诉pyttsx3库在发音时应该使用哪个语音合成引擎。
#
# ```python
# import pyttsx3
#
# engine = pyttsx3.init()
# engine.setProperty('voice', 'com.apple.speech.synthesis.voice.Alex')
# ```
#
# 在这个代码中，首先导入了pyttsx3库，然后初始化了一个新的语音合成引擎。然后，使用setProperty方法来设置发音人。最后，这个新的语音合成引擎就可以用来发音了。
#
# 注意，这个设置可能只在你运行这段代码的电脑上有效。
# 如果你在另一台电脑上运行这段代码，你可能需要设置不同的发音人。
# 要将wav文件中的机器声音转换成人声，可以使用深度学习模型，例如WaveNet。以下是使用Python和TensorFlow实现的步骤：
#
# 安装所需库：
#
# bash
# 复制代码
# pip install tensorflow - gpu == 2.6
# pip install librosa
#
# 下载预训练的WaveNet模型：
#
# bash
# 复制代码
# wget
# https: // storage.googleapis.com / download.tensorflow.org / models / wavenet_vocoder / wavenet_vocoder.zip
# unzip
# wavenet_vocoder.zip
#
# 将音频文件转换为适合WaveNet输入的格式：
#
# python
# 复制代码
# import librosa
# import numpy as np
#
#
# def preprocess_audio(file_path):
#     y, sr = librosa.load(file_path)
#     input_length = 8000
#     if len(y) > input_length:
#         y = y[:input_length]
#     else:
#         y = np.pad(y, (0, max(0, input_length - len(y))), 'constant')
#     return y, sr
#
#
# input_audio, sample_rate = preprocess_audio('input.wav')
#
# 使用WaveNet模型进行转换：
#
# python
# 复制代码
# import tensorflow as tf
# from wavenet_vocoder import WaveNetVocoder
#
#
# def convert_audio(input_audio, sample_rate):
#     vocoder = WaveNetVocoder()
#     output_audio = vocoder.infer(input_audio, sample_rate)
#     return output_audio
#
#
# output_audio = convert_audio(input_audio, sample_rate)
#
# 保存转换后的音频文件：
#
# python
# 复制代码
# import soundfile as sf
# sf.write('output.wav', output_audio, sample_rate)
#
# 这样，你就可以将wav文件中的机器声音转换成人声了。注意，这个示例仅适用于简单的音频转换任务，对于更复杂的场景，可能需要使用更高级的模型和方法。


案例程序：
 
"""
 * `pyttsx3`：这是一个Python语音合成库，可以将文本转换为语音。
     pip install pyttsx3
     使用`pyaudio`或`sounddevice`库来播放音频
     pip install pyaudio
sapi5，即Microsoft Speech API 5，是微软发布的一个文本转语音（Text-to-Speech）引擎。
它内置在Windows系统中，例如Windows XP内置了TTS语音引擎SAPI5.1，Vista、Server 2008内置SAPI5.3，Win7内置SAPI5.4，无需额外安装。
pyttsx3是一个文本到语音转换的Python库，它支持多种TTS引擎包括SAPI5、NSSS（NSSpeechSynthesizer）、espeak等。
通过pyttsx3的使用，我们可以方便地实现文字转语音的功能。例如，首先需要安装pyttsx3和pywin32库，然后使用以下代码即可将文字转化为语音：
"""
 
import pyttsx3
import pyaudio
 
# 初始化语音合成引擎
 
engine = pyttsx3.init()
# mac
# engine.setProperty('voice', 'com.apple.speech.synthesis.voice.Alex')
# Microsoft David Desktop (TTS Engine)  windows
# engine.setProperty('voice', 'Microsoft David Desktop (TTS Engine)')
# engine.setProperty('voice', 'com.apple.speech.synthesis.voice.sinji')
with open('tts_data_zh_CN.txt', 'r', encoding='utf-8') as f:
    text = f.read()
engine.setProperty('language', 'ja')
engine.setProperty('rate', 150)
engine.setProperty('volume', 0.5)
engine.setProperty('pitch', 0.0)
engine.setProperty('emphasis', 50)  # 设置强调程度为50
engine.setProperty('spell', True)
# engine.setProperty('language', 'en')
voices = engine.getProperty('voices')
# for voice in voices:
#     print ('id = {} \nname = {} \n'.format(voice.id, voice.name))
# #     engine.setProperty('voice', voices[1].id)  #设置发音人
engine.setProperty('voice', 'HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\TTS_MS_JA-JP_HARUKA_11.0')
engine.say(text)
engine.runAndWait()
 
 
for voice in voices:
    print("---" * 10, voice.id)
#     engine.save_to_file(text=text, filename='output112.wav')
#
#     engine.setProperty('voice', voice.id)
#     # engine.setProperty('voice', "com.apple.speech.synthesis.voice.sin-ji")
#     engine.say("以官网云教学平台演示为例，首先我们可以登录到大尧科技的官网，点击产品中心就可以看到我们的云教学平台：Hello !")
#     engine.runAndWait()
#     engine.stop()珍惜

珍惜成果，拿走请留香！！

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/88157