Chen Lei
Chen Lei
能获取转发,如果你设置获取全部微博,就会获取原创加转发。第二个可能是乱码问题,我现在没法调试,不确定。
转发和原创微博都能获取。对于转发,程序会分出源微博a和转发语b,它们各自都有id、正文点赞评论等等,会分成两个微博存起来,其中a的retweet_id为kong,b的为a的id。
@hahajason 是不是没加有效cookie?
@hahajason 换个用户呢?
@hahajason 可能和用户有关吧,还有如果cookie无效,很多微博获取不全。
@nmgxx 加cookie了吗?没有有效cookie最多获取50页。
1.目前本程序只能通过减速缓解被限; 2.如果使用txt输入id,大部分id是断点续写的,程序会更新txt对应id的进度(since_date),会从最新日期获取到上次的since_date。
还会重新爬用户信息,因为就一条,没必要断点。
感谢建议。 目前没有更好的方案,所以暂时使用该逻辑。如果有较好的微博文章的判别方法,可以讨论下。
感谢反馈。 如果是设置限制,应该没法绕过吧。