当在多行上匹配表达式时,我总是使用re.DOTALL,它工作正常。现在我偶然发现了re.MULTILINE字符串,看起来它也在做同样的事情。
与re模块(没有使其更清晰,但值不同):
M = MULTILINE = sre_compile.SRE_FLAG_MULTILINE # make anchors look for newline
S = DOTALL = sre_compile.SRE_FLAG_DOTALL # make dot match newline
SRE_FLAG_MULTILINE = 8 # treat target as multiline string
SRE_FLAG_DOTALL = 16 # treat target as a single string那么,在用法上有什么不同,在哪些微妙的情况下,它可以返回不同的东西呢?
发布于 2017-01-12 18:12:00
他们很不一样。是的,两者都会影响换行符的处理方式,但它们会为不同的概念切换行为。
re.MULTILINE影响^和$锚点匹配的位置。
没有开关,^和$只分别在整个文本的开头和结尾匹配。使用该开关,它们还在换行符之前或之后匹配:导入re >>> re.search('foo$','foo\nbar')是None # no match True >>> re.search('foo$','foo\nbar',flags=re.MULTILINE) <_sre.SRE_Match对象;span=(0,3),match='foo'>re.DOTALL影响.模式可以匹配的内容。
如果没有开关,.将匹配除换行符以外的任何字符。对于开关,换行符也是匹配的:re.search('foo.','foo\nbar')是非匹配的真>>> re.search(‘foo’.,'foo\nbar',flags=re.DOTALL) <_sre.SRE_Match对象;span=(0,4),match='foo\n'>发布于 2017-01-12 18:12:06
它不是在做相同的事情,DOTALL也匹配换行符,而MULTILINE使^和$能够在每一行上工作。
示例:
The quick brown fox
jumps over the lazy dog.在这里,.+将在没有DOTALL模式的情况下产生两个结果(第一行和第二行)。如果打开DOTALL,它就匹配整个短语。
The quick brown fox
jumps over the lazy dog.在这里,( ^\w+ )在MULTILINE模式下,将匹配两次,因为的每个行的开头都有一个单词字符。
https://stackoverflow.com/questions/41620093
复制相似问题