根据常见问题解答,Scrapy首先探索深度,但我注意到它会处理10到30个来自start_urls的请求,然后再运行任何更深的请求。
在处理start_urls之前,我可以更改参数并强制scrapy探索深度吗?
参考http://doc.scrapy.org/en/latest/faq.html#does-scrapy-crawl-in-breadth-first-or-depth-first-order
发布于 2019-01-14 21:27:29
作为Apalala suggested,如果您真的想使用Scrapy强制执行特定的请求顺序,inline requests是可行的。
在设计上,Scrapy并不意味着严格遵循请求的顺序,对于大多数用例来说,Request.meta、优先级(来自Request constructor)甚至您提到的DEPTH_PRIORITY setting就足够了。
https://stackoverflow.com/questions/28392830
复制相似问题