当前位置:   article > 正文

nltk.stem 词干提取(stemming)

nltk.stem

 

 

Stemming 可以抽取词的词干或词根形式,NLTK中提供了三种最常用的词干提取器接口

  1. '''基于Porter词干提取算法'''
  2. from nltk.stem.porter import PorterStemmer
  3. porter_stemmer = PorterStemmer()
  4. porter_stemmer.stem(‘multiply’) # u’multipli’
  5. ''' 基于Lancaster 词干提取算法 '''
  6. from nltk.stem.lancaster import LancasterStemmer
  7. lancaster_stemmer = LancasterStemmer()
  8. lancaster_stemmer.stem(‘multiply’) # ‘multiply’
  9. '''基于Snowball 词干提取算法 ''''
  10. from nltk.stem import SnowballStemmer
  11. snowball_stemmer = SnowballStemmer(“english”)
  12. snowball_stemmer.stem(‘multiply’) # u’multipli’

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/743023
推荐阅读
相关标签
  

闽ICP备14008679号