赞
踩
1)从文本中读入数据:(文件的输入输出)
2)不区分大小写,去除特殊字符。
3)统计单词 例如:about :10 并统计总共多少单词
4)对单词排序。出现次数
5)输出词频最高的10个单词和次数
6)把统计结果存入文本
import re
def getword():
# 读取文件
f=open('read.txt','r',encoding='utf-8')
# 将大写转化成小写
word=f.read().lower()
# 关闭文件
f.close()
#利用正则除去特殊字符 |符+
list=re.split('s+|,+|.+|!+|:+|?+|;+|(+|)+|-+|_+|=+|++|“+|、+|/+|{+|}+|”+|:+|。+|“+|[+|]+|【+|】+|—+|%+|"+',word)
# 遍历列表 去除列表中的空格
i = 0
while i < len(list):
if list[i] == '&#
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。