关键词爬虫用户爬虫微博爬虫.zip

上传者: 50040241 | 上传时间: 2021-11-09 18:00:22 | 文件大小: 34.67MB | 文件类型: ZIP
本爬虫是根据GitHub开源项目WeiboSpider自改而来。 改动方面: 1,增加了关键词爬虫,可以根据设置的关键词列表获取近期有关的微博内容(默认为50页),爬取的字段符合该项目其他功能的要求。 2,爬取的逻辑为,关键词到微博到评论到用户关系,将原来的本地CSV读取改为数据库操作,增加了爬虫的效率和数据的可分析性。 3,将时间戳改为人类可读的时间。 4,其他一些细小的方面。 适合的人群: 1,对爬虫技术感兴趣的人 2,需要分析微博数据的人 注:readme文档为源代码的文档,要查看关键词爬虫,请看spider下的keyword.py。并更改相关数据库名称,和cookie。

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明