ZhiHuZhuanLanToPDF
ZhiHuZhuanLanToPDF copied to clipboard
知乎专栏文章导出成 PDF 文档
一键下载: 将知乎专栏导出成电子书
参考自 : https://gitee.com/crossin/snippet/tree/master/get_zhihu
准备工作
需要安装库:requests、bs4、pdfkit(可要可不要 程序代码会使用pdfkit,pdfkit会调用wkhtmltopdf,而wkhtmltopdf会调用windows中的wkhtmltopdf.exe来转化html为pdf。所以可以直接用os.system(cmd)操作)
手动安装 wkhtmltopdf https://wkhtmltopdf.org/
安装可参考 https://github.com/JazzCore/python-pdfkit/wiki/Installing-wkhtmltopdf
关于no such file or directory:b'' 这种错误在python中出现时,意味着有.exe文件需要被调用,而该.exe文件没有被安装或者在控制面板的环境变量中没有添加该.exe的路径。另外,有时候需要改pdfkit代码为下列两句,才可消除错误:
config=pdfkit.configuration(wkhtmltopdf=r"D:\software\wkhtmltopdf\bin\wkhtmltopdf.exe")
实现效果
-
输入专栏名字 获取每篇文章链接

-
获取文章详情 保存为
html文件

-
生成
pdf
TODO
~~* [ ] 速度太慢了,要搞快点。~~