赞
踩
正则表达式是一种可以用于模式匹配和替换的强有力的工具,一个正则表达式就是由普通的字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式,它描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。正则表达式在字符数据处理中起着非常重要的作用,我们可以用正则表达式完成大部分的数据分析处理工作,如:判断一个串是否是数字、是否是有效的Email地址,从海量的文字资料中提取有价值的数据等等,如果不使用正则表达式,那么实现的程序可能会很长,并且容易出错。
正则表达式:cat匹配:cat,catalog,Catherine,sophisticated
正则表达式:c.t匹配:tan,Ten,tin,ton,t n,t#n,tpn等
正则表达式:t[aeio]n匹配:tan,Ten,tin,ton等
正则表达式:t(a|e|i|o|oo)n匹配:tan,Ten,tin,ton,toon等
图一:匹配所有123-12-1234形式的社会安全号码
图二:匹配所有123-12-1234和123121234形式的社会安全号码
图三:匹配典型的美国汽车牌照号码,如8836KV
图四:匹配所有单词,但“X”开头的除外
图五:匹配所有Moth DD,YYYY格式的日期
图六:匹配所有Month DD,YYYY格式的日期,定义月份值为第一个组
图七:匹配所有123-12-1234格式的社会安全号码