WechatSogou
WechatSogou copied to clipboard
[TODO] 搜狗登录
一种另类的思路,用 js 爬虫,"曲线救国" 来解决搜狗登陆问题。用户具体的使用过程如下: step 1. 开发者在自己的 browser 里,访问 weixin.sogou.com step 2. 在网页上,手动登陆 step 3. 在登陆后的 weixin.sogou.com 页面上,打开 browser 的 console. step 4. 调用一段,我们预先写好的 JS 爬虫代码,爬取获得文章的临时链接 step 5. 临时链接可以打包下载,交给我们的 python 爬虫来执行内容爬取&保存
这个思路是在,与@hczhcz 于2016年3、4月份讨论的时候,他所提出的
开了个坑~希望我自己能尽快填完哈(~~~怎么有点不相信自己的填坑效率呢~~~) https://github.com/ax4/WechatSogouJS
已知 Issue:
- 搜狗微信 - 搜文章, 只能显示 100页内容(未登陆仅前 10页,登陆后 100页)
- 使用JS爬虫仍然会跳出验证码。尝试添加Ruokuai