文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Python和Selenium (或其他)跟踪重定向链

问使用Python和Selenium (或其他)跟踪重定向链
EN

Stack Overflow用户

提问于 2017-06-15 01:36:58

回答 2查看 861关注 0票数 0

示例：http://url1.com (javascript重定向) -> url2.com (javascript重定向新窗口) -> url3.com (javascript重定向) -> url4.com (urls未定义，我有大量随机urls)

我的问题是:我不知道track是如何重定向链的。我知道第一个url1，我可以用browser.current_url捕捉最后一个url。但是如何捕获url2、3(以及url1和上一个url之间的所有其他url)。

使用requests很简单：

r = requests.get("http://url1.com")
for ele in r.history:
  print ele.url
print r.url

但是请求不能与Javascript一起工作。

我能做些什么？

python

selenium

redirect

回答 2

Stack Overflow用户

发布于 2017-06-15 14:03:36

你不能用硒做到这一点。

一个简单的解释是301/302状态码重定向是由浏览器在http级别上处理的(同样简化- SE与页面的DOM/ html一起工作)，并且永远不会传播到Selenium。用上一句中的javascript替换Selenium，它仍然是对的。

对于js，您能做的最好的事情就是注入一个beforeunload或unload事件侦听器来捕获并确认url1 -> url2重定向的存在，但仅此而已。

之所以可以使用python的requests库来做这件事，是因为它工作在较低的(http)协议层，并跟踪它们。既然你已经有了解决方案，为什么不在这个测试中使用它呢？

票数 1

Stack Overflow用户

发布于 2021-04-26 18:18:50

正如第一个答案所说的，你不能用selenium做到这一点。但是，您可以将selenium与BrowserMobProxy结合使用，因为webdriver选项支持BrowserMobProxy。

另外，我建议您尝试使用selenium-wire，它扩展了Selenium的Python绑定，使您能够访问浏览器发出的底层请求。您可以使用与使用Selenium相同的方式编写代码，但是可以获得额外的API来检查请求和响应，并对其进行动态更改。请参阅selenium-wire

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44551280

复制

相似问题

问使用Python和Selenium (或其他)跟踪重定向链
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Python和Selenium (或其他)跟踪重定向链EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Python和Selenium (或其他)跟踪重定向链
EN