当前位置:   article > 正文

NLP:NLTK、spaCy、pattern库_nltk wordnet spacy

nltk wordnet spacy

NLTK

spaCy

  • 分句sentencizer
  • 分词Tokenization
  • 词性标注Part-of-speech tagging
  • 词形还原Lemmatization
  • 识别停用词Stop words
  • 依存分析Dependency Parsing
  • 提取名词短语Noun Chunks
  • 命名实体识别Named Entity Recognization
  • 指代消解Coreference Resolution
  • 依存分析可视化Display
  • 知识提取
  • 官网:https://spacy.io/
  • 使用方法:https://www.jianshu.com/p/e6b3565e159d

pattern

官网:https://github.com/clips/pattern

区别于以上两个库的最大优点就是

可以根据要求输出一个动词的不同时态的形式!!

细致讲解:https://blog.csdn.net/weixin_43975374/article/details/107484781

  1. from pattern.en import conjugate, lemma, lexeme, PRESENT, INFINITIVE, PAST, FUTURE, SG, PLURAL, PROGRESSIVE
  2. vb_word = "be"
  3. print(conjugate(vb_word, tense=PRESENT, person=1, number=SG))
  4. print(conjugate(vb_word, tense=PRESENT, person=2, number=SG))
  5. print(conjugate(vb_word, tense=PRESENT, person=3, number=SG))
  6. print(conjugate(vb_word, tense=PRESENT, number=PLURAL))
  7. print(conjugate(vb_word, tense=PRESENT, aspect=PROGRESSIVE))
  8. print(conjugate(vb_word, tense=INFINITIVE))
  9. print(conjugate(vb_word, tense=PAST, aspect=PROGRESSIVE))

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/343431
推荐阅读
相关标签
  

闽ICP备14008679号