CNKI-download
CNKI-download copied to clipboard
:frog: 知网(CNKI)文献下载及文献速览爬虫
无法正常检索论文
-------------------------- | | | 请选择检索条件:(可多选) | |(a)主题 (b)关键词 (c)篇名 | |(d)摘要 (e)全文 (f)被引文献 | |(g)中图分类号 | | | -------------------------- 请选择(以空格分割,如a c):c -------------------------- 您选择的是: 篇名 | -------------------------- 请输入【篇名】:贫化铀 -------------------------- 是否需要规定文献来源(y/n)?n 正在检索中........
我记得知网有个api,选定了是否是pdf文件还是caj文件,caj比较恶心,而且类型还不是所有的软件都支持打开 /kns/download?filename=5UjSyB3SXd0N18mWrImTGNVYTxETNF0QZhXMWl3R2RVTHRnYIVjRuBzT6dmarVEa5gHVGJEeCplQHJETrZ2Q40UQMVmeTNTZTFEM4cnerglV0hDOoVGVI5WRR5mWod2VilUZ2V2QFN1dqJ2ZKtSMZR0LrFWW1t0U&tablename=CAPJLAST&dflag=pdfdown dflag=pdfdown 这个是pdf的下载链接 dflag=cajdown 这个是caj的下载链接 除此之外其余的参数就没什么区别了

> Traceback (most recent call last): File "F:\Python\CNKI-爬虫download\main.py", line 27, in from GetPageDetail import page_detail File "F:\Python\CNKI-爬虫download\GetPageDetail.py", line 203, in page_detail = PageDetail() File "F:\Python\CNKI-爬虫download\GetPageDetail.py", line 39, in __init__ if...
Bumps [urllib3](https://github.com/urllib3/urllib3) from 1.24.1 to 1.26.5. Release notes Sourced from urllib3's releases. 1.26.5 :warning: IMPORTANT: urllib3 v2.0 will drop support for Python 2: Read more in the v2.0 Roadmap Fixed...
修改的地方就是http改成了https,其他没有动过,但是下载下来都是2kb,打开显示已损坏
在具体使用过程中,我发现程序在指定文献期刊来源后,只能检索到期刊内容,无法检索到非期刊文献。例如将文献期刊来源设定为"xx大学",检索结果的来源为“xx大学学报”,数据库为“期刊”。有没有什么方法能检索到硕博士论文? 读过代码后发现,该检索条件传入的参数为“'magazine_value1”,我想要修改此处的参数,尝试了几种方法但是没找到具体该传入什么参数。个人对爬虫和网络相关知识的相当浅薄,想知道此处应该如何修改?感谢大佬
是否需要规定文献来源(y/n)?n 正在检索中..... -------------------------- Traceback (most recent call last): File "/Users/Desktop/CNKI-download-master/main.py", line 259, in main() File "/Users/Desktop/CNKI-download-master/main.py", line 253, in main search.search_reference(get_uesr_inpt()) File "/Users/Desktop/CNKI-download-master/main.py", line 99, in search_reference self.pre_parse_page(second_get_res.text), second_get_res.text) File...
检索论文出现问题
检索到69条结果,全部下载大约需要00小时05分钟45秒。 是否要全部下载(y/n)?y 正在下载: 基于文字识别技术的作业自动批改系统.caj Traceback (most recent call last): File "main.py", line 259, in main() File "main.py", line 253, in main search.search_reference(get_uesr_inpt()) File "main.py", line 99, in search_reference self.pre_parse_page(second_get_res.text), second_get_res.text)...