首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >查找两组字符串之间的字符串(python / urllib2 /漂亮汤)

查找两组字符串之间的字符串(python / urllib2 /漂亮汤)
EN

Stack Overflow用户
提问于 2016-01-07 16:28:41
回答 1查看 448关注 0票数 0

我有以下网页网页的源代码,我正试图从

代码语言:javascript
复制
<span class="reviewCount">
<a href="...Reviews-WHATIWANT-City..." target="_blank" onclick="XX;">1,361 reviews</a>
</span>

编辑(用漂亮的汤):

为了提取这些信息,我使用漂亮的汤解析数据。我使用以下代码:

代码语言:javascript
复制
spans = soup.findAll('span', attrs={"class":u"reviewCount"})
for span in spans:
a = span.find('a')
print re.search('(?<=Reviews-)(.*?)(?=-City)', a.get('href'))

但我得到了这个信息

代码语言:javascript
复制
<_sre.SRE_Match object at 0x7f84fce05300>
<_sre.SRE_Match object at 0x7f84fce05300>
<_sre.SRE_Match object at 0x7f84fce05300>
<_sre.SRE_Match object at 0x7f84fce05300>

而不是“Reviews”和"-City“之间的字节。有人能帮我找到正确的语法吗?谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-08 17:24:59

re.search()返回一个“匹配”对象。如果有匹配,则需要获取保存组值:

代码语言:javascript
复制
spans = soup.find_all('span', attrs={"class":u"reviewCount"})
for span in spans:
    a = span.find('a')
    match = re.search(r'Reviews\-(.*?)\-City', a.get('href'))
    if match:
        print(match.group(1))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34660281

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档