7sDream comments

Results 102 comments of


                                            7sDream

所有单号均无法查询，返回查无结果或错误数据

这就比较奇怪了。我晚上回去用手机试下……

所有单号均无法查询，返回查无结果或错误数据

很奇怪，我用 iPad 里的 Chrome，在家中的网络环境里测试，和白天用公司的网，Mac 上的 Chrome 测试是相同的结果，都是查不出来…… 工作日时间不足，周末有空的话我详细看看。

分离http请求与处理soup这两部分，在此基础上完善test

嗯，我也是考虑到要从网上获取内容，不太好写 tese 的 assert……所以才使用了这么一种形式。想法可行，不过需要的各式各样 html 可能是个大工程，而且有些功能除了 html 之外还会模拟 ajax 获取 json 数据，这部分代码都在函数内部，不好分离。这部分测试如果脱离实际测试起来还是有点麻烦。可以进一步讨论下，一个好的 Test 确实很重要。

分离http请求与处理soup这两部分，在此基础上完善test

zhihu/common.py 里，带有 API，node/xxxv2 的地址基本上是在函数内又进行了 request 的，返回 generator 的属性应该都有 ajax，因为一次取不完…… 我晚上考虑发布一个 0.2.3 版本，然后新开个分支来尝试吧…… 给各个类加上set_soup，再另写一个test脚本。

分离http请求与处理soup这两部分，在此基础上完善test

@glennq 这几天会学校，然后学校要换校区比较忙……So 没啥时间开电脑…… 如果你愿意的可以开始写哒~~

分离http请求与处理soup这两部分，在此基础上完善test

@glennq 刚修复了一个知乎前端图片 src 格式改了的问题，继续写 test 的时候 rebase一下吧~ Thx

分离http请求与处理soup这两部分，在此基础上完善test

然而我发现一个问题啊。。。一般代码修改除了增加新功能之外就是跟进知乎的前端修改（比如最近的图片地址格式修改）。如果 test 使用固定的 html 的话反而不能反映代码的正确性啊。So 我觉得 html 还是得在线获取，如何判断代码是否正确（获取的内容是否正确）还是需要考虑下。

这就是一个爬虫程序吧？

Some test cases failed

是这个样子，因为前端经常变，所以这边这个项目已经挺久没有维护了，您可以换用这个新的： https://github.com/7sDream/zhihu-oauth 新项目架构比较好，而且可能的 Bug 也很少，效率也更高一点。然后这边的bug我会隔大概一个月集中处理一下……现在暂时先放放

目前知乎服务器会限制Request的次数来反爬虫吗

恩，建议提供一下“爬虫停止”的具体表现。因为虽然知乎确实会反爬虫，但是一般来说反爬虫措施会直接导致代码出错，而不是“停止”。