webmagic
webmagic copied to clipboard
如何关闭已经入栈的请求
描述 1、目前项目结合xxl-job https://github.com/xuxueli/xxl-job 进行任务管理,开始执行任务的时候一次把所有目标URL入栈,进行spider.run() 后,运行了几个URL后发现不是想要的结果需要停止本次爬取,这种场景下如何收到关闭爬虫?
或者说在Processor中经过一定判断获取到了想要的结果,如何删除掉队列里待抓取的请求