哥tanh抢夺者
gotham-grabber是一组最初编写的脚本,用于获取Gothamist / DNAinfo网络中某个站点上作家页面的URL,并生成每篇文章的精美PDF集合。 它是在网站于2017年11月2日突然关闭之后创建的。前LAist的主编,Gothamist网络中的网站之一,已经。
自项目开始以来,脚本已扩展为支持来自以下新闻站点的作者页面:
哥tanh(以及-ist网络中的其他站点)
DNA信息
洛杉矶周刊
新闻周刊
金佳
外部Python脚本gothamgrabber.py以带有--url标志的作者页面URL作为参数,在运行它的out子文件夹中创建目录,并保存文章URL列表。 (如果该URL列表已经存在,则gotham-grabber.py可以使用-t或--textfile选项将其作为输入。)然后,它调用一个驱动无头Chrome实例进行捕获和捕获的节点脚本grabb
2021-05-26 18:02:54
12KB
Python
1