由于txt文档的下载是系列下载中最简单的部分,故放在整个系列的第一篇 后续会陆续更新本系列其他文章以及github地址 欢迎访问我的博客 M010K的博客 简介 本项目是基于python实现对百度文库可预览文档的下载,实现了对以下文档格式的下载: doc/docx ppt/pptx xls/xlsx pdf txt :warning_selector:本项目下载的文档均为pdf格式(除txt外) :warning_selector:项目是本人原创,转载请注明出处 :warning_selector:项目是本人课程设计的作品,请勿用于商业用途 具体实现 问题分析 在百度文库随意搜索一篇txt文档,如下图: 发现下载该文档需要使用下载卷,事实上,大多数百度文库的文档均是以支付下载卷的形式下
2021-07-15 14:13:40 919KB 爬虫 百度 百度文库
1
很实用强大的各网站文库爬虫工具
2021-04-08 14:13:25 4.67MB 爬虫工具 文库爬虫 百度爬虫
1