赞
踩
编写程序,实现用户随机输入一段话,统计本段话的高频词汇
- import jieba
- txt = input("请输入一段话:")
- words = jieba.lcut(txt) # jieba.lcut(txt)把文本中的句子精确的切开
- excludes={'。',',','!',';'} #这里是想把一些感叹词给列出来
- counts = {}
- for word in words:
- counts[word]=counts.get(word,0)+1#返回字典counts中word元素对应的值,即0,该代码用来统计次数
- for word in excludes: #循环遍历感叹词
- del counts[word] #利用字典中的del方法,删除相应的键
- items = list(counts.items()) #返回字典键值,并转为列表
- items.sort(key=lambda x:x[1],reverse=True) #利用列表的sort()进行排序,True为降序排序
- for i in range(3): #返回出现次数最好从前三个词
- word,count=items[i]
- print("{0:<5}{1:>5}".format(word,count))
- #大括号相当于是位置,分别对应word和count,冒号是引导符,后面跟的是格式控制方法
- #<表示左对齐,>表示右对齐,数字表示宽度,如<5,左对齐,并占5个位置

Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。