用于下载读秀的包库全文,方法如下:
1、用浏览器(推荐chrome)进入读秀,搜索然后开始浏览包库书籍
2、在浏览器的阅读界面上,右键点击,选择“复制图片地址”
3、将浏览器的cookie另存为“cookies.txt”(chrome推荐使用扩展“Export cookies.txt”,Firefox推荐使用扩展“Export cookies”)
4、将2中复制的图片地址粘贴到附件DownloadDuXiu.sh的第三行,
原来第三行为:url='http://img.sslibrary.com/n........./$nn?zoom=2'
粘贴位置:url='您所复制的图片地址粘贴在这里,请保留两边的单引号'
5、修改上述地址中的页码和图片尺寸: 原来可能为类似于“000002?zoom=0”修改为“$nn?zoom=2”
6、修改第6、7、10行的数字为对应书的前言页数、目录页数、正文页数
7、请确保第11行的cookiefile指向步骤3中保存的cookie文件
8、用linux或cygwin(windows下) 运行DownloadDuXiu.sh
9、当下载页数太多是,会出现需要验证码的情况。脚本会提示失败,请用浏览器翻页,并填写验证码。然后重新启动DownloadDuXiu.sh,脚本会从刚才中断的地方开始,继续下载
另外,脚本没有做验证码的自动识别,欢迎有兴趣的同学加入
1