当前位置:   article > 正文

python词频统计排序小demo_词频排序python

词频排序python

背景
恰逢某只考拉猪宝学python,俺也来玩玩

准备工作
随便来个txt文件,里面写了一些英文(中文也行),这里我们用utf-8格式

主要代码:

with open("The Phantom Rider.txt",  encoding='utf-8') as text:
    words = text.read().split()
    #print(words)
    #for word in words:
        #print('{}-{} times'.format(word, words.count(word)))
word_frequency={}
for word in words:
    if word in word_frequency:
        word_frequency[word]+=1
    else:
        word_frequency[word]=1
word_sort=sorted(word_frequency.items(),key=lambda x:x[1],reverse=True) #根据词频降序排序
print(word_sort)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

通过读入,切片,得到混乱的words表,然后利用frequency作为dict统计每个词出现的频率,然后利用sorted函数对frequency的项进行排序,其中按第二个item即频数排序,倒序

最后便可以得到出现频率最多的词的统计

结果

在这里插入图片描述
总结:
python文件(一定编码格式)读入、内容切片、用字典记录频数、用sorted排序含有两个属性的字典,有点意思!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/109686
推荐阅读
相关标签
  

闽ICP备14008679号