Gerapy
Gerapy copied to clipboard
希望可以有的功能
1、希望可以增加下爬虫的日志监控和报警,方便及时的对爬虫进行异常修复和管理,例如:网络中断、页面改变,反爬等,都会导致爬虫异常,这些信息应该及时的反馈到gerapy平台上供管理员查看;
2、项目部署时,是将项目中的所有爬虫部署到某一台服务器上,是否可以将支持只部署其中的某几只爬虫呢?
谢谢建议。
- 第一个其实相对比较难做,需要对 Scrapy 增加扩展组件,或者在 Scrapyd 端增加状态统计,这部分还可以设定一个阈值,如果超过这个阈值,那么就会触发报警。 管理员等角色划分机制目前没有集成,现在正在集成权限控制机制,会在后续版本发布。
- 这个是可以做的,目前还没有列入计划,后续会不断完善
👍
能不能在部署后运行所有的爬虫,如果有几百几千的爬虫,不会要一个一个点运行或者创建任务吧