“文泉学堂” PDF下载
安装requirements.txt里的依赖
找到你要的书,看地址栏的数字为id
运行python3 crawl_wqxt.py
服务器生成图片需要时间,可能出现未加载,会稍候重试。若一直出现未加载(第二遍还是),请尝试重新运行,已下载的图片不会重新下载。
如果需要清理缓存,请删除wqxt.db或自行更改其内容(SQLite数据库)。
若需要登录,请自行在crawl_wqxt.py的HEADERS(36行)里加Cookie等内容。
请合理使用服务器资源。版权问题概不负责。
imgautocompress.py渐进式下载的图片判断是否为灰度,是否为黑白,并转成相应格式,减少图片大小。
要类似地减少其他扫描版PDF文件大小,可以使用 。要添加OCR层,可使用 。
2022-03-09 15:16:03
10KB
Python
1