赞
踩
pip install nltk
nltk.download()
方法import nltk
nltk.download()
```
from nltk.corpus import stopwards
stopwards.words()
import nltk
[(sentence, category) for category in sentence_polarity.categories()
for sentence in sentence_polarity.sents(categories=category)]
# 返回的是一个大列表,每个元素为一个句子的单词列表和对应褒贬构成元组
from nltk.corpus import wordnet nltk.download('wordnet') syns = wordnet.synsets("bank") # 返回的bank的全部十八个词义的synset同义词集合 print(syns[0].name) # 返回的是bank的第一个词义的名称,其中n代表名词 syns[0].definition() # 返回bank的第二个词义的定义,即为银行的定义,返回的是英语解释 syns[0].examples() # 返回的是bank的第一个使用实例 syns[0].hypernyms() # 返回的是bank第一次词义的同义词集合 dog = wordnet.synset('dog.n.01') cat = wordnet.synset('cat.n.01') dog.wup_similarity(cat) # 计算两个同义词之间的Wu-Palmer的相似度
from nltk.corpus import sentiwordnet
sentiwordnet.senti_synset('good.a.01')
# 词good在形容词adjective下的第一语义,返回的是Poscore和Negscore
from nltk.tokenize import sent_tokenize
text = gutenberg.raw("austen-emma.txt")
sentence = sent_tokenize(text)
# 对Emma小说进行全文分句
print(sentence[100])
# 显示其中一个分句
from nltk.tokenize import word_tokenize
word_tokenize(sentence[100])
from nltk import pos_tag
pos_tag(word_tokenize("They sat by the fire."))
nltk.help.upenn_tagset('NN')
nltk.help.upenn_tagset('VBP')
nltk.help.upenn_tagset() # 返回所有词性的标注集以及各种词性的示例
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。