共1761条数据,爬取时间的为2018年3月18日,数据包括爬取时间,爬取链接,微博url,用户id,用户昵称,用户头像,关注数,粉丝数,发布时间,微博内容, 微博内容txt,发自,转发数,评论数,点赞数,是否长微博,微博配图,视频地址,视频封面,是否转发,原微博,转发,热门评论,评论
2021-12-01 12:17:36 3.49MB 网易新闻微博 爬虫 爬虫数据
1
包含微博爬虫、LDA主题分析和情感分析三个部分。 1.微博爬虫 实现微博评论爬取和微博用户信息爬取,一天大概十万条。 2.LDA主题分析 实现文档主题抽取,包括数据清洗及分词、主题数的确定(主题一致性和困惑度)和最优主题模型的选择(暴力搜索)。 3.情感分析 实现评论文本的情感值计算,准确率超过97%,处于0到1之间。
2021-11-30 09:07:39 79KB 微博
新浪微博爬虫系统 使用模拟登录跳过API对请求的限制,直接获取数据
2021-11-19 20:10:22 200KB Java
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数
2021-11-17 12:37:05 110KB 源码
1
本爬虫是根据GitHub开源项目WeiboSpider自改而来。 改动方面: 1,增加了关键词爬虫,可以根据设置的关键词列表获取近期有关的微博内容(默认为50页),爬取的字段符合该项目其他功能的要求。 2,爬取的逻辑为,关键词到微博到评论到用户关系,将原来的本地CSV读取改为数据库操作,增加了爬虫的效率和数据的可分析性。 3,将时间戳改为人类可读的时间。 4,其他一些细小的方面。 适合的人群: 1,对爬虫技术感兴趣的人 2,需要分析微博数据的人 注:readme文档为源代码的文档,要查看关键词爬虫,请看spider下的keyword.py。并更改相关数据库名称,和cookie。
2021-11-09 18:00:22 34.67MB 爬虫 python 数据分析 微博
基于Python的微博爬虫系统研究
2021-11-03 09:53:45 784KB
python 对微博话题相关微博数据的爬取,并且制成表格输出
2021-11-01 16:32:02 18KB 微博爬虫
1
两周多的结果,不调用新浪微博、腾讯微博等四大微博官方提供的api进行微博内容的抓取,获取到更多的信息,可定制自己的需求。
2021-10-20 19:43:51 6.01MB 微博 网络爬虫 api
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息
2021-10-09 11:19:05 110KB 源码
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息
2021-09-21 23:01:22 110KB 源码
1