Neod Anderjon(LeaderN)
Neod Anderjon(LeaderN)
First of all, the ID 1234 user has no work, of course cannot resolve any valid information. Secondly, the Pixiv website seems to have imposed some kind of blocking mechanism...
I am sorry to tell you now. The R18 page and the artist's personal page crawl failure at the end of June should only be caused by the internal maintenance...
If you want to use newer module pycryptodome, you can modify here: dataload.py L60:  privmatrix.py L98:  privmatrix.py L133:  That's all.
Version V2.8.5 has used pycryptodome instead of pycrypto.
Duplicate of #1 可以将你的整个爬取过程完整截图放出来么,看上去是POST KEY请求不成功,你所在的网络可以正常登录P站么,如果你的网络环境是P站DNS被污染的环境,那么就需要开代理服务器并设置为全局代理,保证在命令行下可以正常查询到P站的DNS
关于文件保存路径这一点,我的设计是自行创建一个保存位置,通过os模块获取系统的HOME目录路径,在其中建立一个文件夹存放下载的图片和日志。如果是Linux系统会直接在您的用户目录的Pictures目录内建立Crawler文件夹保存。比方说您的登录用户名是abc,那么文件保存路径就是/home/abc/Pictures/Crawler 如果您需要更换保存目录则修改这个位置  通过您的截图我猜测您是在手机上利用SSH工具远程执行Ubuntu服务器上的爬虫,请问您是否有赋予爬虫sudo权限?
P站ID就是注册邮箱。 这个错误是由于网站本身验证SSL证书引起的,在我的环境中没有出现过这个异常 您不妨试一下CSDN的这个解决方法https://blog.csdn.net/hudeyu777/article/details/76021573/ URL请求头封装在privmatrix.py的317行,POST key请求头则在privmatrix.py的363行
您指的是关于rtn和ira两种模式的功能实现文档还是解释说明文档?
嗯,我在类的docstring里做了简单的说明
可以的,只要注明出处就可以转载引用