当前位置:   article > 正文

英文词频统计_实验四 树(学习通)编程题1. 词频统计【问题描述】 编写程序统计一个英文文本文件

实验四 树(学习通)编程题1. 词频统计【问题描述】 编写程序统计一个英文文本文件

做一个词频统计程序,该程序具有以下功能
基本要求:
(1)可导入任意英文文本文件
(2)统计该英文文件中单词数和各单词出现的频率(次数),并能将单词按字典顺序输出。
(3)将单词及频率写入文件。
 

  1. /**
  2. *author by daisy
  3. */
  4. import java.io.BufferedReader;
  5. import java.io.BufferedWriter;
  6. import java.io.FileReader;
  7. import java.io.FileWriter;
  8. import java.io.IOException;
  9. import java.util.ArrayList;
  10. import java.util.Collections;
  11. import java.util.Comparator;
  12. import java.util.List;
  13. import java.util.Map;
  14. import java.util.Set;
  15. import java.util.SortedMap;
  16. import java.util.TreeMap;
  17. public class WordFrequencyCount {
  18. public static void main(String[] args) throws IOException {
  19. BufferedReader bufferedReader = new BufferedReader(new FileReader("E:/text.txt"));
  20. BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter("E:/out.txt"));
  21. String s;
  22. while ((s = bufferedReader.readLine()) != null) {
  23. //通过键值对的方式去分别存储单词和出现的次数
  24. Map<String, Integer> map = new TreeMap<String, Integer>();
  25. //创建一个words数组,将split分割的字符串存入数组
  26. String[] words = s.split("[【】、.。,\"!--;:?\'\\] ]");
  27. for (int i = 0; i < words.length; i++) {
  28. String key = words[i].toLowerCase();//将所有单词转化为小写
  29. if (key.length() > 0) {
  30. //用containsKey判断map集合对象中是否包含某个字符串
  31. if (!map.containsKey(key)) {//如果不包括说明第一次出现,则给频率值赋1;
  32. map.put(key, 1);
  33. } else {// 如果不是第一次出现,就把value值++,那么value值是多少就是出现了几次
  34. int value = map.get(key);//用get(key)获取对应的value值
  35. value++;
  36. map.put(key, value);
  37. }
  38. }
  39. }
  40. //利用TreeMap实现Comparator接口
  41. Comparator<Map.Entry<String, Integer>> valueComparator = new Comparator<Map.Entry<String,Integer>>() {
  42. public int compare(Map.Entry<String, Integer> o1,Map.Entry<String, Integer> o2) {
  43. return o1.getKey().compareTo(o2.getKey());//降序排序
  44. }
  45. };
  46. //map转换成list进行排序,Entry是Map中的一个静态内部类,用来表示Map中的每个键值对
  47. //map.EntrySet(),实现了Set接口,里面存放的是键值对.
  48. List<Map.Entry<String, Integer>> list = new ArrayList<Map.Entry<String,Integer>>(map.entrySet());
  49. // 排序
  50. Collections.sort(list,valueComparator);
  51. System.out.println("-----------------按字典顺序排序如下---------------");
  52. for (Map.Entry<String, Integer> entry : list) {
  53. System.out.println(entry.getKey() + "----" + entry.getValue());
  54. bufferedWriter.write(entry.getKey()+"----"+entry.getValue()+"\r\n");
  55. }
  56. }
  57. bufferedWriter.newLine();
  58. // 关闭输入输出流
  59. bufferedReader.close();
  60. bufferedWriter.close();
  61. }
  62. }

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/516366
推荐阅读
相关标签
  

闽ICP备14008679号