Chen Lei
Chen Lei
@void285 1.有可能是cookie失效了,换个看看;2.不是bug,是有意为之,为了提高效率,减少重复爬起取。因为txt是可以手动添加新ID的,如果使用统一since_date,为了获取新ID微博,旧ID也要爬,就重复了。现在更灵活,可以单独为每个ID配置单独的日期,自动更新日期,减少重复,效率也更高。
@void285 感谢反馈。这个应该是逻辑问题,假如某次下载中断了,到底要不要更新txt。如果更新了,下次可能漏爬;如果不更新,下次可能重复爬。程序选择了前者,如果想选后者,需要修改代码,删除中断时更新txt的代码即可。
没有。
程序模拟的是微博网页版的搜索,如果它有地点,应该可以得到。
尽量降低速度。不一定是被ban,有时候图片视频等会下载错误,解决方法参考其它issue。
这个功能是一个网友通过pull request贡献的,我也不清楚。
不建议多开。
直接运行weibo.py。
weibo-search可以爬取指定日期的关键词,位置微博不清楚。
?