当前位置:   article > 正文

统计单词频率(HashMap)

统计单词频率(HashMap)

统计单词的要求很大程度上取决于速度,使用Hash毋庸置疑是目前非常快的(应该是最快的吧)以前我在数据结构课程设计的时候是自己写的Hash函数,呵呵,虽然哪肯定比一般的数组要快的多,但感觉不咋的,最近做编译技术的课程设计,了解到Java中提供一个非常棒的HashMap函数,只需要一步就可以统计单词的频率,现在我来介绍一下:

import java.util.HashMap;

 

public class WordMap {

 

    public static void main(String[] args) {

       String input = "a1,b2,3c,d4d,a1,b2,a1";

       String[] ws = input.split(",");

//做的单词分割,

//如果你要空格分割 String[] ws = input.split(" ");

       HashMap<String,Integer> hm = new HashMap<String, Integer>();

//初始化HashMap

       for(String s:ws)

       {

           if(s.matches("[a-zA-Z]//w+"))

//这里是一个正则表达式,判断的是第一个必须是字母,后面的是一个字母或多个字母,一个//数字或多个数字

           {

              Integer cou = hm.get(s);

//get()方法将产生一个与键相关联的Integer值,然后这个值被递增,为的是记录标识符的//个数

              hm.put(s, cou == null?1:cou+1);

//保存到HashMap中以单词做key,判断单词是否为空,空为1,或则加1

           }

       }

       System.out.println(hm);

//打印HashMap

    }

}

 

 

执行结果:

{a1=3, b2=2, d4d=1}


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/830102
推荐阅读
相关标签
  

闽ICP备14008679号