当前位置:   article > 正文

python 拼音汉字和识字,python-pinyin

python pinyin 注音风格 bopomofo

汉字拼音转换工具(Python 版)

master.svgmaster?svg=truemaster.svgpypinyin.svg12830126.svg

将汉字转为拼音。可以用于汉字注音、排序、检索(Russian translation) 。

License: MIT license

Python version: 2.7, pypy, pypy3, 3.4, 3.5, 3.6, 3.7, 3.8

根据词组智能匹配最正确的拼音。

支持多音字。

简单的繁体支持, 注音支持。

支持多种不同拼音/注音风格。

$ pip install pypinyin

Python 3(Python 2 下把 '中心' 替换为 u'中心' 即可):

>>> from pypinyin import pinyin, lazy_pinyin, Style

>>> pinyin('中心')

[['zhōng'], ['xīn']]

>>> pinyin('中心', heteronym=True) # 启用多音字模式

[['zhōng', 'zhòng'], ['xīn']]

>>> pinyin('中心', style=Style.FIRST_LETTER) # 设置拼音风格

[['z'], ['x']]

>>> pinyin('中心', style=Style.TONE2, heteronym=True)

[['zho1ng', 'zho4ng'], ['xi1n']]

>>> pinyin('中心', style=Style.TONE3, heteronym=True)

[['zhong1', 'zhong4'], ['xin1']]

>>> pinyin('中心', style=Style.BOPOMOFO) # 注音风格

[['ㄓㄨㄥ'], ['ㄒㄧㄣ']]

>>> lazy_pinyin('中心') # 不考虑多音字的情况

['zhong', 'xin']

注意事项 :

拼音结果不会标明哪个韵母是轻声,轻声的韵母没有声调或数字标识(使用 5 标识轻声的方法见 文档 )。

无声调相关拼音风格下的结果会使用 v 表示 ü (使用 ü 代替 v 的方法见 文档 )。

命令行工具:

$ pypinyin 音乐

yīn yuè

$ pypinyin -h

项目代码开发方面的问题可以看看 开发文档 。

目前是通过词组拼音库的方式来解决多音字问题的。如果出现拼音有误的情况,

可以自定义词组拼音来调整词语中的拼音:

>>> from pypinyin import Style, pinyin, load_phrases_dict

>>> pinyin('步履蹒跚')

[['bù'], ['lǚ'], ['mán'], ['shān']]

>>> load_phrases_dict({'步履蹒跚': [['bù'], ['lǚ'], ['pán'], ['shān']]})

>>> pinyin('步履蹒跚')

[['bù'], ['lǚ'], ['pán'], ['shān']]

详见 文档 。

>>> from pypinyin import Style, pinyin

>>> pinyin('下雨天', style=Style.INITIALS)

[['x'], [''], ['t']]

因为根据 《汉语拼音方案》 ,

y,w,ü (yu) 都不是声母。

声母风格(INITIALS)下,“雨”、“我”、“圆”等汉字返回空字符串,因为根据

《汉语拼音方案》 ,

y,w,ü (yu) 都不是声母,在某些特定韵母无声母时,才加上 y 或 w,而 ü 也有其特定规则。 —— @hotoo

如果你觉得这个给你带来了麻烦,那么也请小心一些无声母的汉字(如“啊”、“饿”、“按”、“昂”等)。

这时候你也许需要的是首字母风格(FIRST_LETTER)。 —— @hotoo

如果觉得这个行为不是你想要的,就是想把 y 当成声母的话,可以指定 strict=False ,

这个可能会符合你的预期:

>>> from pypinyin import Style, pinyin

>>> pinyin('下雨天', style=Style.INITIALS)

[['x'], [''], ['t']]

>>> pinyin('下雨天', style=Style.INITIALS, strict=False)

[['x'], ['y'], ['t']]

如果对拼音的准确性不是特别在意的话,可以通过设置环境变量 PYPINYIN_NO_PHRASES

和 PYPINYIN_NO_DICT_COPY 来节省内存。

详见 文档

更多 FAQ 详见文档中的

FAQ 部分。

hotoo/pinyin: 汉字拼音转换工具 Node.js/JavaScript 版。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/203953
推荐阅读
相关标签
  

闽ICP备14008679号