Chen Lei
Chen Lei
能否提供出错的user_id,我尝试看看是不是个性域名信息没有获取准确。 因为如果网页上就是个性域名,获取的就是个性域名。 可以转换成user_id,但是因为要多访问一次网页,效率低,因此不建议这么做。
感谢反馈,已经修复了。 出现这个是因为关注者信息一般有两个超链接,一个是包含昵称的链接,一个是包含“关注”的超链接。第一个可能链接肯能包含user_id或个性域名,第二个一般是user_id。为了尽量获取user_id,选择解析第二个链接。然而刘亦菲是你已关注的用户,所以页面就没有“关注”这个链接了,程序就会解析第一个。现在已经修复,对于未关注的用户,获取user_id;对于已关注的用户,尽量获取user_id,否则获取个性域名。 如果还有其它问题,欢迎继续反馈。
修改requirements.txt,去掉>=8.1.1
感谢反馈。这个可能是接口不稳定的原因。比如某关键词可能有多页,但是在未获取完全时却显示已经没有微博了,再刷新时又有了,这种目前程序还没有处理。
这种情况暂时无法解决,目前程序是根据第n页判断是否存在第n+1页,如果n页出现上面的情况就不会获取下一页了,如果想避免可能需要改成for循环,暂时只想到这种方法。
@SkydustZ 可以改成for循环,最多循环50次,根据次数计算下一页。这应该能多获取微博,但还是有概率某些页面为空,但比之前应该好很多。
我现在不方便调试,不知道是不是微博改版了,还是cookie过期了,你更新下cookie
大家参考下 #262
正常。 这个就是本地的程序,只要运行路径正确,就可以运行。在weibo-follow目录下只需要运行python3 weibo_follow.py,因为weibo_follow.py在该目录下;如果你想在其它目录运行,要使用weibo_follow.py的绝对路径。 如果还有问题,欢迎继续讨论
weibo_spider 有两个版本,源码也是不能随处执行,你说的是weibo_spider pip版,weibo_spider pip版是通过pip安装的,可以随处执行。因为pip版会安装在特有的pip路径下,执行时会在该路径下寻找程序,就可以随处运行。但是源码版该路径下没有,只能我们自己告诉系统代码在哪里。