vansl
Results
4
comments of
vansl
图片地址经过md5加密了,可以看看我的这篇文章http://blog.csdn.net/van_brilliant/article/details/78723878和我的项目
感谢,已修改。
`` 我碰到一个问题是这样的,有些页面的源码是上面这样有两段js文件地址,我之前用的正则匹配到了第一个注释掉的地址,导致得到的常量是错误的。请求404的问题我也遇到过,不清楚是不是网站的反爬机制让ip被封了一段时间,我测试过用代理可以解决。我把代码重写了一遍,水平有限,各位一起完善。
这个js文件地址和里面的常量隔一段时间会变所以我写成每次都重新获取了,不过一次爬虫时间比较短应该不会有问题。我刚刚才看见你的request。我把代码几乎全部重构一遍了。我也是新手一起完善😁