赞
踩
表示python的nltk包真的很好用,本来想着自己从字典里面抓数据的,后来师兄建议用nltk包,
http://www.nltk.org/install.html
按照方法安装了包,接下来
- import nltk
-
- nltk.download()
-
- showing info http://nltk.github.com/nltk_data/
- Out[2]: TrueC:\Users\artemis_zrj\Desktop\nltk-3.0.0
-
- nltk.download()
-
- text=nltk.word_tokenize("And now for something completely different")
-
- nltk.pos_tag(text)
- Out[5]:
- [('And', 'CC'),
- ('now', 'RB'),
- ('for', 'IN'),
- ('something', 'NN'),
- ('completely', 'RB'),
- ('different', 'JJ')]
![](https://csdnimg.cn/release/blogv2/dist/pc/img/newCodeMoreWhite.png)
测试了一切正常。
同时介绍一本书,自然语言处理,虽然是讲自然语言处理的,但是同时也介绍了nltk包的各种应用。
输出的是list数组,数组里面的每个单位是tuple(元组)
有一个包是pattern包,<
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。