由于txt文档的下载是系列下载中最简单的部分,故放在整个系列的第一篇
后续会陆续更新本系列其他文章以及github地址
欢迎访问我的博客
M010K的博客
简介
本项目是基于python实现对百度文库可预览文档的下载,实现了对以下文档格式的下载:
doc/docx
ppt/pptx
xls/xlsx
pdf
txt
:warning_selector:本项目下载的文档均为pdf格式(除txt外)
:warning_selector:项目是本人原创,转载请注明出处
:warning_selector:项目是本人课程设计的作品,请勿用于商业用途
具体实现
问题分析
在百度文库随意搜索一篇txt文档,如下图:
发现下载该文档需要使用下载卷,事实上,大多数百度文库的文档均是以支付下载卷的形式下
1