我试图抓取一个时尚网站,然而,当我试图呈现我想要从刮刮壳爬行的页面时,我会看到它首先加载页面,然后将它重定向到404页面。这是我运行的命令
scrapy shell -s USER_AGENT='Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36' 'http://www.asos.com/search/circle%20skirt?currentpricerange=10-95&q=circle%20skirt&refine=attribute_900:1573'我也尝试过添加标题和cookie,但是似乎没有什么效果,页面一直重定向到404。我该怎么办?
发布于 2018-01-04 05:18:20
得到了解决方案,就像furas评论的那样,response.body拥有我所需要的所有东西,唯一的原因是视图(响应)无法工作,因为站点需要加载JS的东西,这导致了404。谢谢你的帮助,弗拉斯
https://stackoverflow.com/questions/48055395
复制相似问题