本资源为自己人工标记的微博语料,分为消极pos.txt,积极neg.txt 各60000条,适用于机器学习情感分析,训练数据原数据
2019-12-21 21:17:00 8.39MB 情感分析 微博语料 机器学习 标记语料
1
8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。文件为sql脚本,方便直接导入数据库。
2019-12-21 21:09:55 16.09MB 微博数据集
1
新浪微博的用户数据 按字段抓取的
2019-12-21 21:08:29 4.49MB 微博数据 数据挖掘
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。 安装过程: 1.先安装Python环境,作者是Python 2.7.8 2.再安装PIP或者easy_install 3.通过命令pip install selenium安装selenium,它是自动测试、爬虫的工具 4.然后修改代码中的用户名和密码,填写你自己的用户名和密码 5.运行程序,自动调用Firefox浏览
2019-12-21 21:07:35 111KB python
1
爬取新浪微博上的妹纸照片的爬虫程序,来源于中戏北电的美女们的微博上的照片,大学校花们的万张照片唾手可得。程序可复用。
2019-12-21 21:06:07 709KB 新浪微博 爬虫 妹纸照片
1
新浪微博混合云架构应用实践之路.pdf
2019-12-21 20:56:05 4.51MB 新浪微博 混合云架构
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。 安装过程: 1.先安装Python环境,作者是Python 2.7.8 2.再安装PIP或者easy_install 3.通过命令pip install selenium安装selenium,它是自动测试、爬虫的工具 4.然后修改代码中的用户名和密码
2019-12-21 20:55:31 110KB 源码
1
此资料是用来爬取新浪微博评论的,修改最后的uid值即可
2019-12-21 20:47:53 6KB 爬虫 python 微博
1
利用selenium+PlantomJS登录+爬取感兴趣的用户的所有信息 包括昵称,认证,粉丝,关注,所有微博以及每条微博的转发,评论数量等 理论上来讲再加一个链接爬虫可以爬取新浪微博的所有数据 但是由于用的是无壳浏览器导致登录和加载页面速度比较慢 所以实际上基本不可能能实现爬取 代码写完调通就没有管过了,也没有优化过,不过基本的功能都可以实现
2019-12-21 20:44:34 61KB 新浪微博爬虫
1
python大众点评爬虫 150W数据
2019-12-21 20:41:03 16KB 仿新浪微博
1