当前位置:   article > 正文

jieba.analyse+词性标注+统计出场次数+sklearn计算tfidf值_jieba.analyse.extract_tags 出现次数

jieba.analyse.extract_tags 出现次数
import jieba.analyse
sentence='故今日之责任,不在他人,全在我少年。少年智,则国智。少年富,则国富。少年强,则国强。少年独立,则国独立。少年自由,则国自由。少年进步,则国进步。少年胜于欧洲,则国胜于欧洲。少年雄于地球,则国雄于地球。红日初升,其道大光。河出汱流,一泻汪洋。潜龙腾潜龙腾渊,鳞爪飞扬。如虎啸谷,百兽震惶。鹰隼试翼,风尘吹张。奇花初胎,矞矞皇皇。干将发硎,有作其芒。天戴其苍,地履其黄。纵有千古,横有八荒。前途似海,来日方长。美在我少年中国,与天不老。壮哉我中国少年,与国无疆!日本人之称我中国也,一则曰老大帝国,再则曰老大帝国。是语也,盖袭译欧西人之言也。呜呼!我中国其果老大矣乎?梁启超曰:恶,是何言!是何言!吾心目中有一少年中国在'

#基于 TF-IDF提取关键字
keywords=jieba.analyse.extract_tags(sentence,topK=20,withWeight=True,allowPOS=('n','nr','ns'))
#print(type(keywords))
for item in keywords:
    print(item[0],item[1])
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/348492
推荐阅读
相关标签
  

闽ICP备14008679号