Chen Lei
Chen Lei
可以参考我的weiboSpider项目。
感谢反馈。 目前我没有这样的项目,也没有做这个的打算。想到两个实现方法,不知是否可行。 第一个,获取微博的转发用户,再依次获取转发用户的转发; 第二个,搜索微博文本,结果中有原创和转发,提取转发中的昵称,得到转发的单向关系。
我没有获取微博转发用户的项目。 weibo-search是可以获取转发的uid和微博id的,对方法二有用。 若用第一个,要你自己获取。你可以在转发页发现转发它的用户转发的微博id,效率更高。
这个我也不清楚,可以搜索 scrapy调用 看看。
感谢反馈。 search.py的 parse_weibo 的weibo['text']就是微博文本,之前的txt_sel是未处理过的,但是部分表情是image,你可以按自己的需求修改这部分。
@pengjiaqi624 这个我也没获取过,你可以搜索下xpath。
这个我没研究过,你可以搜索scrapy。
是的,无法获取了
有两个方法可能有用,get_follow_list和get_one_page。 get_follow_list控制某一用户关注的进度,首先它获取该用户一共有多少页关注列表,然后再调用get_one_page,依次获取每页的用户信息。get_one_page就是获取关注页的用户信息的,table_list包括某一关注页的用户信息,大约有10个,如果你想保存前2人,可以在循环中计数,等于2人即停止循环。或者在get_one_page计算self.follow_list的长度,满足10就停止,这样就使每个用户尽量获取10个关注。 如果还有问题,欢迎继续讨论
把提示语句改成sys.exit就行 ``` sys.exit(u'cookie无效或提供的user_id无效') ``` 这样有缺点,因为可能是user_id出错了,如果用sys.exit后面正确的user_id就不执行了,现在是跳过出错user_id继续执行