MoivesSpider
MoivesSpider copied to clipboard
这程序需要运行多长时间啊。是不是把所有信息爬完统一录入数据库啊
是的,检索完网站所有的信息,才会入库。我记得运行一次大概要1-2小时。其实代码可以优化下,做断点续传功能,即定时存储到数据库。
做个判断把数据库里最新的ID获取到,爬的时候新增的再爬,已存在的跳过会越来越快