批量备份导出知乎专栏文章,知乎回答,知乎想法等
原文:
整理下苏生不惑开发过的那些软件和脚本mp.weixin.qq.com/s/jpnqgxbeUw-lF0gLUITuGQ

以知乎这个号为例 :
知乎 - 知乎 www.zhihu.com/org/zhi-hu-14-94-58/answers

输入知乎id可以批量下载知乎回答,文章和想法:

下载的html文件在当前目录,目录名为知乎id ,有3个目录:文章,回答和想法,以及一个包含时间,标题,类型的excel文件:



如果想转换为pdf可以用这个脚本:
def export_pdf():
import pdfkit,os
print('导出 PDF...')
htmls = []
for root, dirs, files in os.walk('.'):
for name in files:
if name.endswith(".html"):
print(name)
try:
pdfkit.from_file(name, 'pdf/'+name.replace('.html', '')+'.pdf')
except Exception as e:
print(e)
export_pdf()
专栏文章也可以单独下载,输入知乎专栏id即可批量导出知乎专栏文章为pdf周末又写了个知乎专栏批量下载工具,顺便通知个事,比如 https://www.zhihu.com/column/c_1492085411900530689 这个的c_1492085411900530689 ,导出效果:

生成的pdf文件:

知乎回答一样的:

回答内容也可以批量下载到excel,包括回答人昵称和回答内容:

也可以下载回答里的图片:
