zhihu-python
zhihu-python copied to clipboard
获取知乎内容信息,包括问题,答案,用户,收藏夹信息
1 在auth.py 的所有request.get 的参数里添加了headers 2 在zhihu.py里的更新了一些知乎的新的html标签格式 3 在zhihu.py里对于mac ,默认的anon_user_id = "匿名用户".decode('utf-8').encode('gbk')
Windows系统下终端无法显示颜色,参看: [Why termcolor doesn't work in python](http://stackoverflow.com/questions/21858567/why-termcolor-doesnt-work-in-python)
INFO: 正在加载配置文件 ... INFO: 提取XSRF 代码失败 INFO: 正在调用外部程序渲染验证码 ... INFO: Command: xdg-open verify.gif & 请输入验证码: EPY3 ERROR: 网络异常 ``` Traceback (most recent call last): File "auth.py", line 249, in login()...
{'Content-Encoding': 'gzip', 'Transfer-Encoding': 'chunked', 'Vary': 'Accept-Encoding', 'Server': 'nnws/1.7.3.7', 'Connection': 'keep-alive', 'ETag': *****_', 'Date': 'Sat, 25 Jun 2016 00:27:57 GMT', 'X-Req-ID':**_*********, 'Content-Type': 'text/html'}
# 相关issues #68 #42 # 修正内容 1. 修正获取用户关注话题数bug 2. 修正获取用户关注话题,数组下标越界bug(PS: 起因由 1 引起)
line 878, in get_topics yield topic_list[j].find("strong").string.encode("utf-8") IndexError: list index out of range
实际上感觉这个好像更适合作为 issue 而非 PR 提出来,⊙﹏⊙b汗 原选择语句为:asks_num = int(soup.find_all("span", class_="num")[0].string) 更改后读取的是同一位置:ask_num = int(soup.find_all('a', href="/people/" + self.user_id + "/asks").find("span").string) 但可读性更加良好~ 对于下面的 get_answer_num 也可以考虑更改~,不通过相对位置来获取 string --- 最后一个 PR 了 好吧,通读了一早上的源码,自己写了个 fake-zhihu-python 的程序。只有说 orz……...
在得到图片的 url 和用户 id 之后,下载用户的头像。并创建新的文件夹来保存:-)
我试着用了你们的API获取follow我的知乎人的followers 人数 大部分都运行挺好的 但爬有些人时候 会出现如下错误 我看get_followers_num的原码。。觉得没问题啊 不是很理解 Error in get_followers_num followers_num = int(soup.find("div", class_="zm-profile-side-following zg-clear") \ AttributeError: 'NoneType' object has no attribute 'find_all' 代码如下 ``` if __name__ == '__main__': user_url...
Hi egrcc 添加了爬取 回答的评论 功能。 并更新了test。py 的test case。 请review。 如果有需要,我可以继续完善。