首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用python爬行页面

使用python爬行页面
EN

Stack Overflow用户
提问于 2014-06-14 14:57:53
回答 1查看 583关注 0票数 0

我正在制作一个爬虫,可以用于所有的电子商务网站。目前,我正在以下网站上测试我的爬虫。

link 1

link 2

link 3

link 4

就个人而言,我成功地抓取了所有四个网站,但当我制作一个普通的爬虫时,我不知道如何显示更多的产品。例如:

link 1中,我需要单击显示更多结果,以便显示更多产品。

link 2中,我需要按load more来显示更多的产品。

link 3中,我只需向下滚动即可获得更多产品

link 4中,按下next按钮可以获得更多产品。

每个网站都有不同的按钮类/标签,那么我如何才能确定是按下按钮还是向下滚动。

最初我已经开始使用selenium,但这不是必需的,如果有比Selenium更好的其他模块,我会很乐意使用它。

EN

回答 1

Stack Overflow用户

发布于 2014-06-14 21:07:24

Scrapy实际上不会工作,因为你试图与javascript交互。您将希望坚持使用selenium。firefox有一个selenium插件,允许您记录浏览器上的操作,然后将其导出到python中。所以点击、加载和滚动都不成问题。

要获取外接程序,请遵循以下说明...http://www.wikihow.com/Download-Selenium-IDE-Addon

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24217456

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档