我正在使用python脚本在文本文件中运行行。我想在文本文档中搜索一个img标记,并将标记作为文本返回。
当我运行regex re.match(line)时,它返回一个_sre.SRE_MATCH对象。如何让它返回字符串?
import sys
import string
import re
f = open("sample.txt", 'r' )
l = open('writetest.txt', 'w')
count = 1
for line in f:
line = line.rstrip()
imgtag = re.match(r'<img.*?>',line)
print("yo it's a {}".format(imgtag))运行时,它会打印:
yo it's a None
yo it's a None
yo it's a None
yo it's a <_sre.SRE_Match object at 0x7fd4ea90e578>
yo it's a None
yo it's a <_sre.SRE_Match object at 0x7fd4ea90e578>
yo it's a None
yo it's a <_sre.SRE_Match object at 0x7fd4ea90e578>
yo it's a <_sre.SRE_Match object at 0x7fd4ea90e5e0>
yo it's a None
yo it's a None发布于 2013-08-28 16:44:26
您应该使用re.MatchObject.group(0)。喜欢
imtag = re.match(r'<img.*?>', line).group(0)编辑:
你也可以做一些类似的事情
imgtag = re.match(r'<img.*?>',line)
if imtag:
print("yo it's a {}".format(imgtag.group(0)))以消除所有的None。
发布于 2013-08-28 16:45:20
imgtag.group(0)或imgtag.group().这将以字符串的形式返回整个匹配。你也没有捕获任何其他东西。
http://docs.python.org/release/2.5.2/lib/match-objects.html
发布于 2017-04-24 08:09:27
注意,re.match(pattern, string, flags=0)只在字符串的开头返回匹配。如果希望在字符串中的任何位置找到匹配项,请使用re.search(pattern, string, flags=0) (https://docs.python.org/3/library/re.html)。这将扫描字符串并返回第一个match对象。然后,您可以按照人们的建议使用match_object.group(0)提取匹配的字符串。
https://stackoverflow.com/questions/18493677
复制相似问题