当前位置:   article > 正文

将一句汉字文本转化为对应的拼音_pinyin(text, style=style.tone3)

pinyin(text, style=style.tone3)

语音合成时,数据预处理,需要将一句汉字文本转化为对应的拼音,其中,汉字文本包含标点符号,而拼音含有声调不含标点符号

具体格式举例如下:

输入:“设置文件名,怎么样?”

输出:she4 zhi4 wen2 jian4 ming2 zen3 me5 yang5

代码如下:

  1. import re
  2. from pypinyin import pinyin, Style
  3. text = '“设置文件名,怎么样?”'
  4. # 先去掉所有的标点,也就是去掉所有的非汉字
  5. text = re.sub(u"[^\u4e00-\u9fa5]", "", text)
  6. print(text)
  7. # 再将每个字转化为带声调的拼音
  8. pinyins = [p[0] for p in pinyin(text, style=Style.TONE3, strict=False, neutral_tone_with_five=True)]
  9. pinyins = ' '.join(pinyins).strip()
  10. print(pinyins)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/203989
推荐阅读
相关标签
  

闽ICP备14008679号