微博爬虫 新浪微博爬虫 该工具首先模拟用户登录新浪微博,目的是获取cookie ; 然后用keyword抓取微博结果。 要求 查看 pip 需求文件requirements.txt rsa 快速开始 运行工具:python run.py 去做 拿来 线程池 邮件
2022-03-22 19:30:45 186KB Python
1
作者简介 作者 QQ交流群 个人博客 项目详情请参考微信原文链接: 如有疑问可通过公众号找到作者,微信扫描下方二维码或者在微信内搜索 微信公众号:月小水长(ID:inspurer); WeiboSuperScrapy 最强微博爬虫,用户、话题、评论一网打尽。 GUI 功能集中版 运行 GUI.py 即可爬取用户/话题微博 运行 WeiboCommentScrapy.py 并修改里面的微博id (wid) 即可爬取指定微博的所有评论。 无 GUI 功能独立版 单独的 py 文件分别对立一个 功能 WeiboCommentScrapy.py 爬取评论 WeiboTopicScrapy.py 爬取指定关键词的所有微博,突破了 50 页的限制,可指定截至日期时间段搜索(比如 20200101-20200102) WeiboSuperCommentScrapy.py 可爬取一条微博的所有评论,更
1
这是一个能够全自动无限制连续爬取新浪微博的图形界面工具。利用代理IP的方式实现全自动获取s.weibo.com站点的搜索结果的html文件。输入你想获取微博数据的关键字,例如“马航”,“章泽天”后,程序自动获取html文件保存到本地,然后解析得到微博数据,保存为txt和xml文件格式。微博数据包括: 微博文本,微博作者名,微博作者id,微博id,评论数,转发数,微博发送日期时间。 解压后有软件工程文件夹,包含源码。一个可执行jar包,需要jdk环境,win和mac下双击可运行。一个readme文件以及所有需要用到的第三方jar包。 如果你想了解更多关于此工具的原理和内容,请参考我的博客: http://blog.csdn.net/codingmirai/article/category/1836377 如果你积分不够下载,可以给我发邮件索要:hainanlxs(at)gmail(dot)com 也欢迎email交流代码的问题。
1
微博爬虫
2021-05-13 18:03:41 20KB 爬虫
1