scrapy_for_zh_wiki
scrapy_for_zh_wiki copied to clipboard
提出一点建议
按代码逻辑来看是dfs而不是bfs,同时用全局队列会导致同一个页面被访问多次, 改了以后速度从 0.3page/1s -> 8page/1s
作者可能需要队列为空来表示结束, 可以舍弃掉这个队列设计, 用signal来结束。 同时一些简单的优化,比如set代替list来提高速度
您好,欢迎提出PR