当前位置:   article > 正文

python语言转换库snowballstemmer

snowballstemmer

安装

pip install snowballstemmer

这是一款非常瘦小的语言转换库,支持15种语言。

  1. 'danish': 丹麦语,
  2. 'dutch': 荷兰语,
  3. 'english': 英语,
  4. 'finnish': 芬兰语,
  5. 'french': 法语,
  6. 'german': 德语,
  7. 'hungarian': 匈牙利语,
  8. 'italian': 意大利语,
  9. 'norwegian': 挪威语,
  10. 'porter': 波特语,
  11. 'portuguese': 葡萄牙语,
  12. 'romanian': 罗马尼亚语,
  13. 'russian': 俄语,
  14. 'spanish': 西班牙语,
  15. 'swedish': 瑞典语,
  16. 'turkish': 土耳其语,

snowballstemmer模块有两个功能

snowballstemmer.algorithms函数报道查看一个可用的算法名称“字符串列表。

  1. import snowballstemmer
  2. >>> snowballstemmer.algorithms()
  3. ['danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian', 'italian', 'norwegian', 'porter', 'portuguese', 'romanian', 'russian', 'spanish', 'swedish', 'turkish']

该snowballstemmer.stemmer函数接受算法名称并报道查看Stemmer对象。

Stemmer有对象Stemmer.stemWord(word)方法状语从句:Stemmer.stemWords(word[])方法。

  1. import snowballstemmer
  2. stemmer = snowballstemmer.stemmer('english');
  3. print(stemmer.stemWords("We are the world".split()));
  4. ['We', 'are', 'the', 'world']
  1. from snowballstemmer import EnglishStemmer, SpanishStemmer
  2. EnglishStemmer().stemWord("Gregory")
  3. # Gregori
  4. SpanishStemmer().stemWord("amarillo")
  5. # amaril

参考:https://pypi.org/project/snowballstemmer/
https://github.com/shibukawa/snowball_py

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/614510
推荐阅读
相关标签
  

闽ICP备14008679号