当前位置:   article > 正文

Python文本解析之字符统计与词频排序_def is_word(word): for item in list(word): if item

def is_word(word): for item in list(word): if item not in 'qwertyuiopasdfghj

一、文本字符统计 

  1. fr = open('兰亭集序.txt','rt',encoding='utf-8')
  2. fw = open('兰亭集序-字符统计.txt','wt',encoding='utf-8')
  3. txt_str = fr.read().strip().strip('\n')#不统计空格和回车'\n'
  4. #遍历文本字符串,把字符、数量写入字典键值对
  5. #把字符、数量分别存入列表
  6. ##key_list = []
  7. ##value_list = []
  8. txt_dict = {}
  9. parse_ls = []
  10. for item in txt_str:
  11. if item not in txt_dict.keys():
  12. ## key_list.append(item)#列表为可变数据类型
  13. ## value_list.append(txt_str.count(item))
  14. txt_dict[item] = txt_str.count(item)
  15. else:
  16. continue
  17. else:
  18. print('统计完成!')
  19. #是否有把2个列表的元素赋给字典{key:value}={字符:数量}的方法?
  20. #txt_dict[key_list] = value_list
  21. #统计结果写入csv
  22. for key in txt_dict:
  23. parse_ls.append("{}:{}".format(key,txt_dict[key]))
  24. fw.write(','.join(parse_ls))
  25. print('写入完成!')
  26. fr.close()
  27. fw.close

二、文本词频排序

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/109679
推荐阅读
相关标签
  

闽ICP备14008679号