Description
将知乎上特定的内容(如某用户答案,某收藏夹答案,某专栏文章)爬下来,保存为html格式的文件,并同时生成epub文件,以离线查看。
TODO:
1. 登陆用户(可能需要解决识别验证码的问题)
2. 按照用户ID爬取答案
* 爬取该用户的所有答案
* 爬取该用户某个时间段的答案
...
3. 按照收藏夹ID爬取答案
4. 按照专栏爬取答案
5. 根据问题ID爬取答案,
* 爬取所有答案
* 爬取赞同数前十的答案
* 收集赞同数超过10K的答案
...
6. 将答案生成epub电子书(实现混排,即上述的四点可以随机组合在一起)
7. 图形界面
2023-03-09 00:00:26
26KB
Python
1