赞
踩
一、文本字符统计
- fr = open('兰亭集序.txt','rt',encoding='utf-8')
- fw = open('兰亭集序-字符统计.txt','wt',encoding='utf-8')
- txt_str = fr.read().strip().strip('\n')#不统计空格和回车'\n'
-
- #遍历文本字符串,把字符、数量写入字典键值对
- #把字符、数量分别存入列表
- ##key_list = []
- ##value_list = []
- txt_dict = {}
- parse_ls = []
- for item in txt_str:
- if item not in txt_dict.keys():
- ## key_list.append(item)#列表为可变数据类型
- ## value_list.append(txt_str.count(item))
- txt_dict[item] = txt_str.count(item)
- else:
- continue
- else:
- print('统计完成!')
-
- #是否有把2个列表的元素赋给字典{key:value}={字符:数量}的方法?
- #txt_dict[key_list] = value_list
-
- #统计结果写入csv
- for key in txt_dict:
- parse_ls.append("{}:{}".format(key,txt_dict[key]))
- fw.write(','.join(parse_ls))
- print('写入完成!')
- fr.close()
- fw.close
二、文本词频排序
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。