python非贪婪、多行匹配正则表达式例子


一些regular的tips:

1 非贪婪flag

 >>> re.findall(r"a(\d+?)", "a23b")
        ['2']
>>> re.findall(r"a(\d+)", "a23b")
        ['23']

注意比较这种情况:

      >>> re.findall(r"a(\d+)b", "a23b")
        ['23']
>>> re.findall(r"a(\d+?)b", "a23b")
        ['23']

2 如果你要多行匹配,那么加上re.S和re.M标志
re.S:.将会匹配换行符,默认.不会匹配换行符

       >>> re.findall(r"a(\d+)b.+a(\d+)b", "a23b\na34b")
        []
>>> re.findall(r"a(\d+)b.+a(\d+)b", "a23b\na34b", re.S)
        [('23', '34')]
>>>

re.M:^$标志将会匹配每一行,默认^和$只会匹配第一行

 >>> re.findall(r"^a(\d+)b", "a23b\na34b")
        ['23']
>>> re.findall(r"^a(\d+)b", "a23b\na34b", re.M)
        ['23', '34']

但是,如果没有^标志,

>>> re.findall(r"a(\d+)b", "a23b\na23b")
        ['23', '23']

可见,是无需re.M


《 “python非贪婪、多行匹配正则表达式例子” 》 有 6 条评论

  1. re.M:^$标志将会匹配每一行,默认^和$只会匹配第一行
    >>> re.findall(r”^a(\d+)b”, “a23b\na34b”)
    [’23’]

    如果:
    >>> re.findall(r”a(\d+)b$”, “a23b\na34b”, re.M)
    [’34’]
    此时匹配的是第二行的34.

  2. 看看这个2个的区别

    >>> re.findall(r”a+”, “sdf+s+d+baaa4dfd”)
    [‘aaa’]
    >>> re.findall(r”(a)+”, “sdf+s+d+baaa4dfd”)
    [‘a’]

  3. 有个问题:

    re.findall(r”(\+\w)+”, “sdf+s+d+b334dfd”)

    这行code中我其实是想匹配”+s+d+b”的,在别的正则测试工具中也能正确匹配出,但是在python中只能匹配出 “+b”,也就是最后一个(\+\w)模式

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据