spiders
spiders copied to clipboard
一个NodeJs爬虫集,包括知乎、豆瓣、拉勾等网站爬虫
A Store of Spiders
-
知乎爬虫
有两个版本,数据库版本和JSON文件版本。具体说明参见项目内部说明文档。
-
拉勾爬虫
主要是统计不同岗位在不同城市的分布情况:公司规模,需求年限等,本来想结合地图做热力图分布图啥的,还是太懒。。。
-
豆瓣爬虫
根据标题关键词筛选选定小组内的帖子。
PS:欢迎大家把自己手上的爬虫拿出来分享哈!
另外,还请顺手给个star呗!<( ̄ˇ ̄)/
上面的图有点问题?我什么也不知道呀!(/ω╲*)纯真脸*