搜索【微博爬虫】的结果

新浪微博爬虫工具WeiboCrawler2.2

这是一个能够全自动无限制连续爬取新浪微博的图形界面工具。利用代理IP的方式实现全自动获取s.weibo.com站点的搜索结果的html文件。输入你想获取微博数据的关键字，例如“马航”，“章泽天”后，程序自动获取html文件保存到本地，然后解析得到微博数据，保存为txt和xml文件格式。微博数据包括：微博文本，微博作者名，微博作者id，微博id，评论数，转发数，微博发送日期时间。解压后有软件工程文件夹，包含源码。一个可执行jar包，需要jdk环境，win和mac下双击可运行。一个readme文件以及所有需要用到的第三方jar包。如果你想了解更多关于此工具的原理和内容，请参考我的博客： http://blog.csdn.net/codingmirai/article/category/1836377 如果你积分不够下载，可以给我发邮件索要：hainanlxs(at)gmail(dot)com 也欢迎email交流代码的问题。

2021-12-07 21:04:14 4.8MB 新浪微博爬虫 新浪微博 WeiboCrawler HttpClient

1

WeiboSpider:微博爬虫，直接输入姓名和密码就可以了，需要安装selenium和ChromeDriver-源码

WeiboSpider 微博爬虫，直接输入姓名和密码就可以了，需要安装selenium和ChromeDriver Huazhong University of Science and Technology Computer Science and Technology Wang Tong

2021-12-05 15:02:23 8KB Python

1

Python实现微博爬虫源码.rar

功能：连续爬取一个或多个新浪微博用户（如胡歌、迪丽热巴、郭碧婷）的数据，并将结果信息写入文件或数据库。写入信息几乎包括了用户微博的所有数据，主要有用户信息和微博信息两大类，前者包含用户昵称、关注数、粉丝数、微博数等等；后者包含微博正文、发布时间、发布工具、评论数等等，因为内容太多，这里不再赘述。

2021-12-01 20:41:34 27KB 微博爬虫

1

网易新闻微博数据

共1761条数据，爬取时间的为2018年3月18日，数据包括爬取时间，爬取链接，微博url，用户id，用户昵称，用户头像，关注数，粉丝数，发布时间，微博内容，微博内容txt，发自，转发数，评论数，点赞数，是否长微博，微博配图，视频地址，视频封面，是否转发，原微博，转发，热门评论，评论

2021-12-01 12:17:36 3.49MB 网易新闻微博 爬虫 爬虫数据

1

基于微博数据的舆情分析项目，包括微博爬虫、LDA主题分析和情感分析。

包含微博爬虫、LDA主题分析和情感分析三个部分。 1.微博爬虫实现微博评论爬取和微博用户信息爬取，一天大概十万条。 2.LDA主题分析实现文档主题抽取，包括数据清洗及分词、主题数的确定（主题一致性和困惑度）和最优主题模型的选择（暴力搜索）。 3.情感分析实现评论文本的情感值计算，准确率超过97%，处于0到1之间。

2021-11-30 09:07:39 79KB 微博

SinaWeiboCrawler:新浪微博爬虫系统-源码

新浪微博爬虫系统使用模拟登录跳过API对请求的限制，直接获取数据

2021-11-19 20:10:22 200KB Java

1

python新浪微博爬虫，爬取微博和用户信息 (源码)

这是新浪微博爬虫，采用python+selenium实现。免费资源，希望对你有所帮助，虽然是傻瓜式爬虫，但是至少能运行。同时rar中包括源码及爬取的示例。参考我的文章： http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括：新浪微博手机端用户信息和微博信息。用户信息：包括用户ID、用户名、微博数、粉丝数、关注数

2021-11-17 12:37:05 110KB 源码

1

关键词爬虫用户爬虫微博爬虫.zip

本爬虫是根据GitHub开源项目WeiboSpider自改而来。改动方面： 1，增加了关键词爬虫，可以根据设置的关键词列表获取近期有关的微博内容（默认为50页），爬取的字段符合该项目其他功能的要求。 2，爬取的逻辑为，关键词到微博到评论到用户关系，将原来的本地CSV读取改为数据库操作，增加了爬虫的效率和数据的可分析性。 3，将时间戳改为人类可读的时间。 4，其他一些细小的方面。适合的人群： 1，对爬虫技术感兴趣的人 2，需要分析微博数据的人注：readme文档为源代码的文档，要查看关键词爬虫，请看spider下的keyword.py。并更改相关数据库名称，和cookie。

2021-11-09 18:00:22 34.67MB 爬虫 python 数据分析 微博

基于Python的微博爬虫系统研究.zip

基于Python的微博爬虫系统研究

2021-11-03 09:53:45 784KB

python 爬虫

python 对微博话题相关微博数据的爬取，并且制成表格输出

2021-11-01 16:32:02 18KB 微博爬虫

1

个人信息

热门下载

最新下载

其他资源