首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >解析BeautifulSoup 4中的类

解析BeautifulSoup 4中的类
EN

Stack Overflow用户
提问于 2015-04-11 05:37:59
回答 1查看 93关注 0票数 0

基本上,我想访问html表中的元素。

下面是我的代码:

代码语言:javascript
复制
r = requests.get('http://www.google.com/finance?q=NYSE%3Aibm&ei=Hz4oVZq-PISjiQKYu4GoAQ')

soup = BeautifulSoup(r.content)

td = soup.find_all('td', class_='ctsymbol')

我什么也得不到...[]

我在同一个td上尝试了这种方法,但这一次是在本地文本文件上,似乎工作得很好。我做错了什么?

EN

回答 1

Stack Overflow用户

发布于 2015-04-11 05:44:09

页面中根本没有这样的元素:

代码语言:javascript
复制
>>> import requests
>>> from bs4 import BeautifulSoup
>>> r = requests.get('http://www.google.com/finance?q=NYSE%3Aibm&ei=Hz4oVZq-PISjiQKYu4GoAQ')
>>> soup = BeautifulSoup(r.content)
>>> {c for e in soup.find_all('td') if 'class' in e.attrs for c in e['class']}
set(['name', 'val', 'p', 'i', 'period', 'itxt', 'lft', 't', 'key', 'colHeader', 'linkbtn'])

这是在所提供的HTML中的<td>元素上使用的所有类的集合。考虑到您不能依赖在浏览器开发工具中找到的元素树,因为它们反映了JavaScript代码运行后的页面。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29571091

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档