这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。 安装过程: 1.先安装Python环境,作者是Python 2.7.8 2.再安装PIP或者easy_install 3.通过命令pip install selenium安装selenium,它是自动测试、爬虫的工具 4.然后修改代码中的用户名和密码,填写你自己的用户名和密码 5.运行程序,自动调用Firefox浏览器登陆微博 注意:手机端信息更加精致简单,而且没有动态加载的一些限制,但是如微博或粉丝id只显示20页,这是它的缺点; 而客户端可能存在动态加载,如评论和微博,但是它的信息更加完整。 [源码] 爬取移动端微博信息 spider_selenium_sina_content.py 输入: 明星用户id列表,采用URL+用户id进行访问(这些id可以从一个用户的关注列表里面获取) SinaWeibo_List_best_1.txt 输出: 微博信息及用户基本信息 SinaWeibo_Info_best_1.txt Megry_Result_Best.py 该文件用户整理某一天的用户微博信息,如2016年4月23日 [源码] 爬取客户端微博信息 爬取客户端信息,但是评论是动态加载,还在研究中 weibo_spider2.py By:Eastmount 2016-04-24
2019-12-21 19:41:38 111KB python 新浪爬虫 新浪微博 selenium
1
新浪微博logo源文件PSD及AI格式 可以应用于印刷,海报设计,平面设计,网站设计等
1
李韩飞 疯狂java新浪微博代码
2019-12-21 19:37:37 5.19MB 新浪 微博 代码
1
android开发新浪微博客户端源代码.rar
2019-12-21 19:37:24 2.72MB android
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息
2019-12-21 19:36:53 110KB 源码
1
方便快捷的第三方登录已经整理好了,大家有什么意见提出来,相互交流共同进步
2019-12-21 19:36:22 36.21MB 第三方登录 QQ 微信 新浪微博
1
python新浪微博爬虫python新浪微博爬虫python新浪微博爬虫python新浪微博爬虫python新浪微博爬虫python新浪微博爬虫python新浪微博爬虫python新浪微博爬虫
2019-12-21 19:33:53 111KB 微博爬虫
1
仿新浪微博 数据库 存储过程 asp.net 源码GridView 这我写的一个项目,现在把源码写出和大家一起分享一下 我的QQ:979170768想结交更多的软件开发好友,和芯片,嵌入式开发好友,一起学习进步
2019-12-21 19:30:30 7.36MB 仿新浪微博 数据库 存储过程 asp.net
1
数据概述:本数据集为63641个用户的新浪微博数据集,包括以下内容: 63641个新浪微博用户信息 数据格式:用户uid,用户昵称,用户姓名,用户所在地,用户主页url,用户性别,用户粉丝数,用户关注数,用户微博数,用户收藏数,用户创建时间; 84168条在2014-05-03至2014-05-11采的关于12个主题的微博信息 数据格式:微博mid,发布时间,微博内容,微博来源,微博转发数,微博评论数,微博被赞数,发表用户uid,微博所属主题。 12个主题包括魅族,小米,火箭队,林书豪,恒大,韩剧,雾霾,房价,同桌的你,公务员,贪官,转基因。 1391718条用户好友关系 每条记录由suid和tuid两个字段组成,表示suid关注tuid,由于新浪微博的限制,每个用户最多只能获取到200个关注人的信息,故好友关系不是很全; 27759条微博转发关系 每条记录由smid和tmid两个字段组成,表示smid微博转发tmid微博。
2019-12-21 19:27:15 131.78MB 微博数据集 话题聚类
1
8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。包含63641个用户,文件为sql脚本,可直接导入数据库。
2019-12-21 19:27:15 16.06MB 微博数据集 话题聚类
1