当前位置:   article > 正文

java 字符串模糊匹配_java模糊匹配字符串

java模糊匹配字符串
  1. java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现. Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式,
  2. Java代码示例: Pattern p=Pattern.compile("\\w+");
  3. p.pattern();//返回 \w+

pattern() 返回正则表达式的字符串形式,其实就是返回Pattern.complile(String regex)的regex参数

1、Pattern.split(CharSequence input)
 Pattern有一个split(CharSequence input)方法,用于分隔字符串,并返回一个String[].
Java代码示例:
  1. Pattern p=Pattern.compile("\\d+");
  2. String[] str=p.split("TestPattern97Matcher");
结果:str[0]="TestPattern" str[1]="Matcher"

2、Pattern.matcher(String regex,CharSequence input)是一个静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串.
Java代码示例:
  1. Pattern.matches("\\d+","2223");//返回true
  2. Pattern.matches("\\d+","2223aa");//返回false,需要匹配到所有字符串才能返回true,这里aa不能匹配到
  3. Pattern.matches("\\d+","22bb23");//返回false,需要匹配到所有字符串才能返回true,这里bb不能匹配到

3、Pattern.matcher(CharSequence input)
Pattern.matcher(CharSequence input)返回一个Matcher对象.
Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例.
Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持.
Java代码示例:
  1. Pattern p=Pattern.compile("\\d+");
  2. Matcher m=p.matcher("22bb23");
  3. m.pattern();//返回p 也就是返回该Matcher对象是由哪个Pattern对象的创建的

4、Matcher.matches()/ Matcher.lookingAt()/ Matcher.find()
Matcher 类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false

matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true
  1. Pattern p=Pattern.compile("\\d+");
  2. Matcher m=p.matcher("22bb23");
  3. m.matches();//返回false,因为bb不能被\d+匹配,导致整个字符串匹配未成功.
  4. Matcher m2=p.matcher("2223");
  5. m2.matches();//返回true,因为\d+匹配到了整个字符串

在仅使用一次正则表达式时,可以方便地通过此类定义 matches 方法。此方法编译表达式并在单个调用中将输入序列与其匹配
即Pattern.matcher("\\d+","22bb23")与 Pattern.compile("\\d+").matcher("22bb23").matches()  等价

lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true
  1. Pattern p=Pattern.compile("\\d+");
  2. Matcher m=p.matcher("22bb23");
  3. m.lookingAt();//返回true,因为\d+匹配到了前面的22
  4. Matcher m2=p.matcher("aa2223");
  5. m2.lookingAt();//返回false,因为\d+不能匹配前面的aa

find()对字符串进行匹配,匹配到的字符串可以在任何位置.
  1. Pattern p=Pattern.compile("\\d+");
  2. Matcher m=p.matcher("22bb23");
  3. m.find();//返回true
  4. Matcher m2=p.matcher("aa2223bb");
  5. m2.find();//返回true
  6. Matcher m3=p.matcher("aabb");
  7. m3.find();//返回false

find(int start) 从指定索引开始匹配
  1. Pattern p=Pattern.compile("\\d+");
  2. Matcher m=p.matcher("aa2223bb");
  3. m.find(5); // 返回true
  4. m.find(6); // 返回false

5、Mathcer.start()/ Matcher.end()/ Matcher.group()
当使用matches(),lookingAt(),find()执行匹配操作后,就可以利用以上三个方法得到更详细的信息.
start()返回匹配到的子字符串在字符串中的索引位置.
end()返回匹配到的子字符串的最后一个字符在字符串中的索引位置.
group()返回匹配到的子字符串
  1. Pattern p=Pattern.compile("\\d+");
  2. Matcher m=p.matcher("aaa2223bb");
  3. m.find();//匹配2223
  4. m.start();//返回3
  5. m.end();//返回7,返回的是2223后的索引号
  6. m.group();//返回2223
  7. Mathcer m2=m.matcher("2223bb");
  8. m.lookingAt();   //匹配2223
  9. m.start();   //返回0,由于lookingAt()只能匹配前面的字符串,所以当使用lookingAt()匹配时,start()方法总是返回0
  10. m.end();   //返回4
  11. m.group();   //返回2223
  12. Matcher m3=m.matcher("2223bb");
  13. m.matches();   //匹配整个字符串
  14. m.start();   //返回0,原因相信大家也清楚了
  15. m.end();   //返回6,原因相信大家也清楚了,因为matches()需要匹配所有字符串
  16. m.group();   //返回2223bb

start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer类还有一个groupCount()用于返回有多少组.
  1. Pattern p=Pattern.compile("([a-z]+)(\\d+)");
  2. Matcher m=p.matcher("aaa2223bb");
  3. m.find(); //匹配aaa2223
  4. m.groupCount(); //返回2,因为有2组
  5. m.start(1); //返回0 返回第一组匹配到的子字符串在字符串中的索引号
  6. m.start(2); //返回3
  7. m.end(1); //返回3 返回第一组匹配到的子字符串的最后一个字符在字符串中的索引位置.
  8. m.end(2); //返回7
  9. m.group(1); //返回aaa,返回第一组匹配到的子字符串
  10. m.group(2); //返回2223,返回第二组匹配到的子字符串

现在我们使用一下稍微高级点的正则匹配操作,例如有一段文本,里面有很多数字,而且这些数字是分开的,我们现在要将文本中所有数字都取出来,利用java的正则操作是那么的简单.
Java代码示例:
  1. Pattern p=Pattern.compile("\\d+");
  2. Matcher m=p.matcher("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@aaa.com");
  3. while(m.find()) {
  4. System.out.println(m.group());
  5. }
输出:
456456
0532214
123

如将以上while()循环替换成
  1. while(m.find()) {
  2. System.out.println(m.group());
  3. System.out.print("start:"+m.start());
  4. System.out.println(" end:"+m.end());
  5. }
则输出:
456456
start:6 end:12
0532214
start:19 end:26
123
start:36 end:39

现在大家应该知道,每次执行匹配操作后start(),end(),group()三个方法的值都会改变,改变成匹配到的子字符串的信息,以及它们的重载方法,也会改变成相应的信息.

注意:只有当匹配操作成功,才可以使用start(),end(),group()三个方法,否则会抛出java.lang.IllegalStateException,也就是当matches(),lookingAt(),find()其中任意一个方法返回true时,才可以使用.


文章参考 :http://blog.csdn.net/kofandlizi/article/details/7323863


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/499127
推荐阅读
相关标签
  

闽ICP备14008679号