dongdongHi

Results 10 comments of dongdongHi

> # 问题 > 大佬,按照你的代码无法获取用户回答,只能获取用户基本信息。我就想你那样在run文件中只运行user_crawler `2022-04-24 10:10:53.824 | WARNING | zhihu_crawler.extractors:extract_data:526 - method: extract_user return: {'user_id': '4a69baf4e0a552d2047fabcc4501a0bb', 'user_name': '我们的太空', 'user_url_token': 'wo-men-de-tai-kong', 'user_head_img': 'https://pic2.zhimg.com/v2-af532a0c65340c09a4549e1e8194e050_l.jpg?source=32738c0c', 'user_is_org': True, 'user_headline': '太空不再高冷 知乎走近你我', 'user_type': 'people',...

> `headers`参数`x-zse-93`似乎已经由`101_3_2.0`升级为`101_3_3.0` 这个加密方式应该还是一样的,只是参数变了吧。之前也都有升级

@zhouyuchong 你可以看看加密参数是否正确。目前该项目,在我的环境是能正常采集的

@zhouyuchong page_iterators.py 第一个函数有一个写死的参数。你看看是否是这里的问题

@Joenothing-lst page_iterators.py 第一个函数有一个写死的参数。你看看是否是这里的问题

@zhouyuchong js没有特殊处理啊。这个爬虫我构建好之后,就丢给组员去维护了。加密如有升级,替换最新的js加密就好了

@zhouyuchong 问题解决了吗?我这个是为了贴合公司业务写的。写的有点糙,还存有不少坑

@zhouyuchong 我这目前还没看到反馈相关问题,也没去管,就这样吧。能使起来就行

zhihu_scraper.py下有个set_proxy函数,调用他就可以达到切换代理的