这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。 安装过程: 1.先安装Python环境,作者是Python 2.7.8 2.再安装PIP或者easy_install 3.通过命令pip install selenium安装selenium,它是自动测试、爬虫的工具 4.然后修改代码中的用户名和密码
2019-12-21 20:55:31 110KB 源码
1
内含三个文件,分别是:爬取微博、数据预处理、爬取并处理。基于python3,实现了高效爬取微博数据,并结合正则表达式对数据进一步处理。其中亦包含对微博评论和点赞等其他信息的爬取,小小修改一下代码即可。
2019-12-21 20:47:41 6KB 爬虫 python3 微博 数据
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。 安装过程: 1.先安装Python环境,作者是Python 2.7.8 2.再安装PIP或者easy_install 3.通过命令pip install selenium安装selenium,它是自动测试、爬虫的工具 4.然后修改代码中的用户名和密码,填写你自己的用户名和密码 5.运行程序,自动调用Firefox浏览器登陆微博 注意:手机端信息更加精致简单,而且没有动态加载的一些限制,但是如微博或粉丝id只显示20页,这是它的缺点; 而客户端可能存在动态加载,如评论和微博,但是它的信息更加完整。 [源码] 爬取移动端微博信息 spider_selenium_sina_content.py 输入: 明星用户id列表,采用URL+用户id进行访问(这些id可以从一个用户的关注列表里面获取) SinaWeibo_List_best_1.txt 输出: 微博信息及用户基本信息 SinaWeibo_Info_best_1.txt Megry_Result_Best.py 该文件用户整理某一天的用户微博信息,如2016年4月23日 [源码] 爬取客户端微博信息 爬取客户端信息,但是评论是动态加载,还在研究中 weibo_spider2.py By:Eastmount 2016-04-24
2019-12-21 19:41:38 111KB python 新浪爬虫 新浪微博 selenium
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息
2019-12-21 19:36:53 110KB 源码
1
给定微博id和爬取评论数量,爬取对应微博的评论,便于下一步的分词和词频统计
2019-12-21 19:33:13 3KB 爬虫 代码 微博评论
1
使用Python,对爬取微博的评论,进行jieba分词,统计词频,修改路径即可。
2019-12-21 19:33:13 835B jieba 分词 微博评论
1
不知道为什么现在上传的资源不能够免费使用,给大家带来的不便尽情谅解。 文档包括代码使用,cookie验证,基本的代码说明等内容。
2019-12-21 19:22:58 795KB 爬取微博 转发链接 说明文档
1
这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息
2019-12-21 18:57:32 110KB 源码
1