feapder icon indicating copy to clipboard operation
feapder copied to clipboard

轻量爬虫-AirSpider - feapder-document

Open Boris-code opened this issue 3 years ago • 8 comments

https://boris.org.cn/feapder/#/usage/AirSpider

feapder是一款支持分布式、批次采集、任务防丢、报警丰富的python爬虫框架

Boris-code avatar Mar 15 '21 12:03 Boris-code

tql,bg yyds

WuT-fage avatar Mar 18 '21 12:03 WuT-fage

  1. 失败重试 中 code 应该替换为 status_code

ChinaEamonn avatar Mar 24 '21 14:03 ChinaEamonn

@ChinaEamonn 8. 失败重试 中 code 应该替换为 status_code

是的,明天我改下

Boris-code avatar Mar 24 '21 14:03 Boris-code

你好,部分情况下数据抓取量会比较少,想存储为csv格式,请问这个怎么用类似yield item的方法进行存储。

ShellMonster avatar May 27 '21 10:05 ShellMonster

@ShellMonster 你好,部分情况下数据抓取量会比较少,想存储为csv格式,请问这个怎么用类似yield item的方法进行存储。

自定义pipeline: https://boris-code.gitee.io/feapder/#/source_code/pipeline

Boris-code avatar May 27 '21 11:05 Boris-code

@ShellMonster 你好,部分情况下数据抓取量会比较少,想存储为csv格式,请问这个怎么用类似yield item的方法进行存储。

自定义pipeline

Boris-code avatar Aug 06 '21 05:08 Boris-code

浏览器渲染是异步的吗?为什么使用chrome时会浏览器闪退,爬取失败?是chromedriver的问题?

zhutuo avatar Oct 14 '21 01:10 zhutuo

@Boris-code

@ShellMonster 你好,部分情况下数据抓取量会比较少,想存储为csv格式,请问这个怎么用类似yield item的方法进行存储。

自定义pipeline: https://boris-code.gitee.io/feapder/#/source_code/pipeline 可以说得清楚点吗? 自定义pipline还要创建 item,可是存 csv/excel 的话根本不需要 item(需要db)吧?还是说直接在 parse 里存到 csv/excel 就好了?

Dumbliidore avatar Oct 17 '21 04:10 Dumbliidore