ydf0509
ydf0509
你怎么启动代码的,你用gevent部署web吗.
配置文件添加 worker_class = 'gthread' ,不用gevent部署就好了.
中国人中文阅读比较直观,英文文档的话,要写中英文两个文档,耗费时间.
你这种需求用阿里云的容器部署就好了,funboost自带的远程部署是简单使用的。
taskid 等额外信息放在extra字典里面
你看看项目的更新时间就知道了,现在代理网站都打不开了,需要你自己去找网站,然后写解析函数,代理框架提供删除和检测功能,获取的代理函数需要用户自己去找网站和写解析。就是人家不愿意免费提供代理了,网站都倒闭了,懂了吗。
ip代理池使用新的nb_proxyppol,采用更加万能写法统一的funboost函数框架驱动, 去看nb_proxypool项目,nb_proxypool才实时维护.
seleiun版本高了。
> 那应该使用那个版本? 高版本的selieum去掉了phantomjs支持了,这些报错就算你看不懂英文报错提示,你复制到百度 google网上很容易搜索的
> 这个api接口有没有说明文档,设置代理,设置header,cookie,有没有requests.session功能 cookie session 代理ip,自己去看http模块需要,这只举例性能。 代理ip一看你就是爬虫了,那cpu速度就不是最关键的了,你能对第三方网站每秒爬3000次吗不反扒吗?如果你无法自己学习python内置的http模块的用法,那就老老实实用requests爬虫就好了。 我这个主要是针对公司内部的http api调用,没有反扒和代理。