当前位置:   article > 正文

词频统计_word count进行词频统计

word count进行词频统计
%%writefile 词频统计.py
# 打开并读取文件
file = open(r'C:\Users\Administrator\Desktop\Walden.txt','r')
# file.read()  # 字符串
lines = file.readlines()
lines # 字符串
# 要把每行拆成单词
words = []

for line in lines:
    tmp_list =line.split(" ")
    for word in tmp_list:
        words.append(word.replace(',','').replace('.','').replace('"','').replace(':',''))
words
# 对words中每一个元素计算他出现的个数
# 把统计结果保存到字典中,字典的key是单词,value是单词出现的次数
word_count = {}
word_set = set(words)
for word in word_set:
    count_num = words.count(word)
    word_count[word] = count_num
    
word_count
# 对word——count字典进行排序,按照出现的次数(value)进行降序排序
sorted(word_count.items(),key=lambda item:item[1],reverse=True)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
Writing 词频统计.py
  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/731435
推荐阅读
相关标签
  

闽ICP备14008679号