Chen Lei
Chen Lei
我知道了。因为部分微博数量较多,接口只能显示一部分,后面都是空。所以为了避免无用的页面,就直接跳过了,这是无法避免的。这个问题在[cookie版](https://github.com/dataabc/weiboSpider)是能解决的,如果方便,可以使用cookie版。
cookie版end_date值不是now时,如果微博很多,不太稳定,会出现漏微博的情况,为now时应该不会出现,你可以把值设为now。
这应该是你添加了代码,会不会是编码没设置好
感谢反馈。目前只支持获取到日期,如果想精确到时间,暂时可以使用[cookie版](https://github.com/dataabc/weiboSpider/)。如果还有问题,欢迎继续交流。
感谢建议。 这个暂时无法添加。程序无法知道起始日期在第几页,只能通过某些方法获取,还没有特别好的方式。可以手动指定微博起始页数,修改get_pages方法的self.start_page就能行,只是这样每次都得手动输入,比较麻烦。或者使用[cookie版](https://github.com/dataabc/weiboSpider),这个是支持指定范围的,缺点是只在微博数量较少时有效,多了可能会漏爬。 如果还有问题,欢迎继续讨论。
这个不能,只能设置从过去到现在日期,不过可以设置从第几页开始获取,变相实现日期改变,只是这个的日期不准。weibospider可以实现时间段,只是会漏掉部分微博
可能现在的代码还存在bug,我现在不方便调试,到时候再看看。
感谢反馈并给出了解决方法。如果方便,您可以以pull request的方式提交代码吗?这样你可以成为本项目的contributor,这不是强制的,如果不方便,我在以后自己修改。再次感谢。
感谢反馈。评论只有在写入结果为sqlite模式时才有效。
@akatinn 默认放在weibo文件夹下的weibodata.db内