赞
踩
背景
恰逢某只考拉猪宝学python,俺也来玩玩
准备工作
随便来个txt文件,里面写了一些英文(中文也行),这里我们用utf-8格式
主要代码:
with open("The Phantom Rider.txt", encoding='utf-8') as text:
words = text.read().split()
#print(words)
#for word in words:
#print('{}-{} times'.format(word, words.count(word)))
word_frequency={}
for word in words:
if word in word_frequency:
word_frequency[word]+=1
else:
word_frequency[word]=1
word_sort=sorted(word_frequency.items(),key=lambda x:x[1],reverse=True) #根据词频降序排序
print(word_sort)
通过读入,切片,得到混乱的words表,然后利用frequency作为dict统计每个词出现的频率,然后利用sorted函数对frequency的项进行排序,其中按第二个item即频数排序,倒序
最后便可以得到出现频率最多的词的统计
结果
总结:
python文件(一定编码格式)读入、内容切片、用字典记录频数、用sorted排序含有两个属性的字典,有点意思!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。