文章/答案/技术大牛

发布

社区首页 >问答首页 >查找两组字符串之间的字符串(python / urllib2 /漂亮汤)

问查找两组字符串之间的字符串(python / urllib2 /漂亮汤)
EN

Stack Overflow用户

提问于 2016-01-07 16:28:41

回答 1查看 448关注 0票数 0

我有以下网页网页的源代码，我正试图从

<span class="reviewCount">
<a href="...Reviews-WHATIWANT-City..." target="_blank" onclick="XX;">1,361 reviews</a>
</span>

编辑(用漂亮的汤)：

为了提取这些信息，我使用漂亮的汤解析数据。我使用以下代码：

spans = soup.findAll('span', attrs={"class":u"reviewCount"})
for span in spans:
a = span.find('a')
print re.search('(?<=Reviews-)(.*?)(?=-City)', a.get('href'))

但我得到了这个信息

<_sre.SRE_Match object at 0x7f84fce05300>
<_sre.SRE_Match object at 0x7f84fce05300>
<_sre.SRE_Match object at 0x7f84fce05300>
<_sre.SRE_Match object at 0x7f84fce05300>

而不是“Reviews”和"-City“之间的字节。有人能帮我找到正确的语法吗？谢谢。

regex

beautifulsoup

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-08 17:24:59

re.search()返回一个“匹配”对象。如果有匹配，则需要获取保存组值：

spans = soup.find_all('span', attrs={"class":u"reviewCount"})
for span in spans:
    a = span.find('a')
    match = re.search(r'Reviews\-(.*?)\-City', a.get('href'))
    if match:
        print(match.group(1))

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34660281

复制

相似问题

问查找两组字符串之间的字符串(python / urllib2 /漂亮汤)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问查找两组字符串之间的字符串(python / urllib2 /漂亮汤)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问查找两组字符串之间的字符串(python / urllib2 /漂亮汤)
EN