一些regular的tips:
1 非贪婪flag
>>> re.findall(r"a(\d+?)", "a23b") ['2'] >>> re.findall(r"a(\d+)", "a23b") ['23']
注意比较这种情况:
>>> re.findall(r"a(\d+)b", "a23b") ['23'] >>> re.findall(r"a(\d+?)b", "a23b") ['23']
2 如果你要多行匹配,那么加上re.S和re.M标志
re.S:.将会匹配换行符,默认.不会匹配换行符
>>> re.findall(r"a(\d+)b.+a(\d+)b", "a23b\na34b") [] >>> re.findall(r"a(\d+)b.+a(\d+)b", "a23b\na34b", re.S) [('23', '34')] >>>
re.M:^$标志将会匹配每一行,默认^和$只会匹配第一行
>>> re.findall(r"^a(\d+)b", "a23b\na34b") ['23'] >>> re.findall(r"^a(\d+)b", "a23b\na34b", re.M) ['23', '34']
但是,如果没有^标志,
>>> re.findall(r"a(\d+)b", "a23b\na23b") ['23', '23']
可见,是无需re.M
《 “python非贪婪、多行匹配正则表达式例子” 》 有 6 条评论
re.M:^$标志将会匹配每一行,默认^和$只会匹配第一行
>>> re.findall(r”^a(\d+)b”, “a23b\na34b”)
[’23’]
如果:
>>> re.findall(r”a(\d+)b$”, “a23b\na34b”, re.M)
[’34’]
此时匹配的是第二行的34.
貌似不是只会匹配第一行。
请指教
看看这个2个的区别
>>> re.findall(r”a+”, “sdf+s+d+baaa4dfd”)
[‘aaa’]
>>> re.findall(r”(a)+”, “sdf+s+d+baaa4dfd”)
[‘a’]
有个问题:
re.findall(r”(\+\w)+”, “sdf+s+d+b334dfd”)
这行code中我其实是想匹配”+s+d+b”的,在别的正则测试工具中也能正确匹配出,但是在python中只能匹配出 “+b”,也就是最后一个(\+\w)模式
宝宝好可爱,网站也有意思
记性不好啊,还是记下来好。前面刚看过非贪婪,又忘了。