7sDream
7sDream
这就比较奇怪了。 我晚上回去用手机试下……
很奇怪,我用 iPad 里的 Chrome,在家中的网络环境里测试,和白天用公司的网,Mac 上的 Chrome 测试是相同的结果,都是查不出来…… 工作日时间不足,周末有空的话我详细看看。
嗯,我也是考虑到要从网上获取内容,不太好写 tese 的 assert……所以才使用了这么一种形式。 想法可行,不过需要的各式各样 html 可能是个大工程,而且有些功能除了 html 之外还会模拟 ajax 获取 json 数据,这部分代码都在函数内部,不好分离。这部分测试如果脱离实际测试起来还是有点麻烦。 可以进一步讨论下,一个好的 Test 确实很重要。
zhihu/common.py 里,带有 API,node/xxxv2 的地址基本上是在函数内又进行了 request 的,返回 generator 的属性应该都有 ajax,因为一次取不完…… 我晚上考虑发布一个 0.2.3 版本,然后新开个分支来尝试吧…… 给各个类加上set_soup,再另写一个test脚本。
@glennq 这几天会学校,然后学校要换校区比较忙……So 没啥时间开电脑…… 如果你愿意的可以开始写哒~~
@glennq 刚修复了一个知乎前端图片 src 格式改了的问题,继续写 test 的时候 rebase一下吧~ Thx
然而我发现一个问题啊。。。一般代码修改除了增加新功能之外就是跟进知乎的前端修改(比如最近的图片地址格式修改)。如果 test 使用固定的 html 的话反而不能反映代码的正确性啊。So 我觉得 html 还是得在线获取,如何判断代码是否正确(获取的内容是否正确)还是需要考虑下。
no
是这个样子,因为前端经常变,所以这边这个项目已经挺久没有维护了,您可以换用这个新的: https://github.com/7sDream/zhihu-oauth 新项目架构比较好,而且可能的 Bug 也很少,效率也更高一点。 然后这边的bug我会隔大概一个月集中处理一下……现在暂时先放放
恩,建议提供一下“爬虫停止”的具体表现。 因为虽然知乎确实会反爬虫,但是一般来说反爬虫措施会直接导致代码出错,而不是“停止”。