wechat_articles_spider issues

Results 8 wechat_articles_spider issues

Sort by recently updated

utils.py和demo(test_GetUrls.py)中的问题

首先感谢分享！在运行代码的时候发现utils.py第189行timestamp2date(dt)报错，缺少一个格式化输入。阅读源码后认为这段代码可以删去，或者给定一个日期格式化，否则会在爬取第一轮（10次）的时候报错中断，删去这行代码后代码运行正常。此外，给出的demo test_GetUrls.py中，84-88行中的url并没有定义（不过可能就是这样写防小白的？）第27行item=line赋值可以删去，第24行改为` for i, line in enumerate(lst, 0):` 同时，第56行需要判断flag是否为1，而这时会报错flag没有定义。应在前面定义flag函数，如在24行加入`flag = 0` 根据get_history_urls返回的数据格式，应在24行lst遍历前，加入一个遍历，如： `def demo(lst_list): fj = "" item_lst = [] flag = 0 for lst in lst_list:...

mouwumou

关于获取微信文章链接

对于获取微信文章链接，提供一种思路，就是通过wx小助手将最新文章的推送转发出来

linuxliu

fiddler抓取到的appmsg_token为空，这是为什么

xdq2005adam

提示公众号cookie或token错误，是被反爬了吗

我改了下test_WechatUrls.py，用自己注册的公众号的token和cookies，想抓大概20多个公众号8月份至今的所有文章url，之前试过直接每个号抓50个，第一遍好像能抓完，结果没保存下来，后来再抓就报cookie或token错误了，过了一天我改成每个号只抓5个的话也差最后3个公众号抓不到报错，不过我发现有些好设置抓5个，但返回了7-10个文章，还有我用create_time转datetime发现和点开url网页页面上的时间不一致。主要是有没有啥办法能不被反爬ban掉，可以抓的慢一点，不太方便再搞更多的公众号了。

jyzhao1008

抓取列表返回unknown error是永封了吗

xzbdmw

test_GetUrls.py 中的参数问题

个人微信号登陆后获取的key，隔段时间更新，这个key应该在哪里获得

twanghey

爬取公众号历史文章数据部分参数注释有误

**wechat_articles_spider/wechatarticles/ArticlesUrls.py**中的注释如下： ```python def get_urls(self, nickname=None, biz=None, begin=0, count=5): """ 获取公众号的每页的文章信息 Parameters ---------- nickname : str 需要爬取公众号名称 biz : str 需要爬取公众号的biz, 优先 begin: str or int 起始爬取的页数 count: str or int...

jiayu1011

好像微信强制更新之后，找不到getappmsgext的接口了。

我上个月还是可以抓到的这个接口的，但是之后一次微信强制更新，fiddle就抓不到这个了。 ![image](https://github.com/wnma3mz/wechat_articles_spider/assets/76757657/fdc62b20-47ef-496c-9ba2-51126248443d)

wjcom9

wechat_articles_spider
wechat_articles_spider copied to clipboard

Metadata

utils.py和demo(test_GetUrls.py)中的问题

关于获取微信文章链接

fiddler抓取到的appmsg_token为空，这是为什么

提示公众号cookie或token错误，是被反爬了吗

抓取列表返回unknown error是永封了吗

test_GetUrls.py 中的参数问题

爬取公众号历史文章数据部分参数注释有误

好像微信强制更新之后，找不到getappmsgext的接口了。

← Metadata

Owner

Metadata

wechat_articles_spider wechat_articles_spider copied to clipboard

Metadata

← Metadata

Owner

Metadata

wechat_articles_spider
wechat_articles_spider copied to clipboard