当前位置:   article > 正文

Python3正则表达式之:(?(id/name)yes-pattern|no-pattern)条件性匹配

(?(id/name)yes-pattern|no-pattern)

Python3[正则表达式]之:(?(id/name)yes-pattern|no-pattern)条件性匹配

1. 用途

(?(id/name)yes-pattern|no-pattern)的作用是:

对于给出的id或者name,先尝试去匹配 yes-pattern部分的内容;

如果idname条件不满足,则去匹配no-pattern部分的内容;

这句话听着还是很拗口的,或者说一下子还是很难懂的。

2. 参数含义

此处的name或id,是针对(当前位置的)条件性匹配之前的,某个已经通过group去分组的内容

name: 如果是有命名的分组,即named group,则对应的该分组就有对应的name,即此处所指的就是对应的name;

id: 如果是无命名的分组,即unnamed group,则对应的该分组也有对应的分组的编号,称为group的number,也叫做id,对应的就是这里的id;

yes-pattern: 如果前面的group匹配成功,则此处,就执行yes-pattern的匹配;

no-pattern: 如果前面group匹配不成功,即没有找到符合该的group内容,则就匹配no-pattern;

注意: 上面的yes-patternno-pattern,都是普通的正则表达式,用来匹配所需的内容。

3. 语法

如果存在no-pattern,则前面要有个竖杠’|’,用来分隔yes-patternno-pattern

如果不想匹配no-pattern的部分,则可以连同’|'一起不写。

实例:

|

1

|

>>> re.search(r``'(\d+)?(?(1)\w+|pythontab\.\w+)'``, ``'pythontab.com'``)>>> re.search(r``'(\d+)?(?(1)\w+)'``, ``'100pythontab'``)

|

其中的?(1)代表序号为1的group, 也就是上面(\d+), 第二个表达式中就没有使用no-pattern

4. 用法详解

还是上面的例子, 我们变换一下, 用实例探索它们的详细用法及技巧

4.1 把(\d+)后面的问号去掉, 也就是说必须存在group 1,不是可有可无

执行:

>>> re.search(r``'(\d+)(?(1)\w+|pythontab\.\w+)'``, ``'pythontab.com'``)

>>>

|

整体规则匹配失败,返回为空,no-pattern部分并没有按照预想执行。

4.2 改一下匹配字符串

>>> re.search(r``'(\d+)(?(1)\w+|pythontab\.\w+)'``, ``'1pythontab.com'``)

|

可以匹配到, group1和yes部分都匹配到了

4.3 group可有可无的情况(group后增加问号)

|

>>> re.search(r``'(\d+)?(?(1)\w+|pythontab\.\w+)'``, ``'pythontab'``)

>>>

|

如果group没有匹配到,且它可有可无, 那么group会被认为匹配不成功,继续执行no-pattern部分匹配

4.4 只匹配group 1 部分, yes部分没有匹配

|

1

|

>>> re.search(r``'(\d+)(?(1)\w+|pythontab\.\w+)'``, ``'1000'``)

|

只匹配group 1 部分, yes部分没有匹配,也是有匹配结果的, 那说明yes-pattern和no-pattern不一定必须匹配成功

5.结论

1. 通过4.1 4.2  4.3 对比可以发现:

当该特殊规则中的作为判断条件的组本身不允许为空的时候,在该组对目标字符串匹配为空的情况下,整体规则匹配失败,所以后面的作为整体一部分的特殊规则自然也就无效了。所以要想特殊规则的no-pattern生效,必须判断条件对应组匹配数可以为0。

2. 通过4.4可知:可以仅匹配group部分, 如果yes-patternno-pattern没有匹配到, 则会仅输出group匹配的内容

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/113547
推荐阅读
相关标签
  

闽ICP备14008679号