这是新浪微博爬虫,采用python+selenium实现。 免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。同时rar中包括源码及爬取的示例。 参考我的文章: http://blog.csdn.net/eastmount/article/details/50720436 [python爬虫] Selenium爬取新浪微博内容及用户信息 http://blog.csdn.net/eastmount/article/details/51231852 [Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上) 主要爬取内容包括: 新浪微博手机端用户信息和微博信息。 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。 安装过程: 1.先安装Python环境,作者是Python 2.7.8 2.再安装PIP或者easy_install 3.通过命令pip install selenium安装selenium,它是自动测试、爬虫的工具 4.然后修改代码中的用户名和密码
2023-02-03 16:24:35 111KB 源码
1
功能是:获取新浪微博1000w用户的基本信息和每个爬取用户最近发表的50条微博,使用python编写,多进程爬取,将数据存储在了mongodb中
2022-12-29 16:27:55 66KB Python
1
harmonyos 2 Nodejs 模拟登录新浪微博 node版本 node v7.5.0, 使用了 async/await 语法 运行方法 由于 async/await 是ES7中的,所以运行时要加上--harmony-async-await 参数 git clone git@github.com:ruansongsong/nodejs-weibo-login.git cd node-spider-of-weibo npm install node --harmony-async-await index.js 登录模块使用方法 const weiboLogin = require('./lib/weibo_login.js').weiboLogin; (async() => { await new weiboLogin('用户名', '密码2').init(); /* 以下为你获取html的操作 */ // 获取html示例,参见 index.js 中的 getHtml() 函数 let result = await getHtml(); // 输出 console.log(
2022-12-23 11:50:01 1.07MB 系统开源
1
NULL 博文链接:https://tonyj.iteye.com/blog/1897604
2022-12-08 18:04:59 4.86MB 源码 工具
1
新浪微博接口开发文档,很实用,大基本接口功能介绍等等
2022-11-21 13:48:08 2.53MB 微博 api 接口
1
高仿新浪微博弹框菜单
2022-11-09 12:16:36 151KB Android
1
本模板仅支持记事狗微博3.0utf8版本,gbk版本请自行转换,安装方法: 第一步:备份templates\default\topic_index.html 第二步:上传templates至微博根目录 第三步:更新缓存
1
Android应用设计源码安卓实例源代码,仅供学习及设计参考。
android应用源码(精)新浪微博客户端源码,android安卓实例应用源代码,仅供学习及设计参考。
抓取新浪微博数据, python学的不多, 代码写的比较烂 需要一些依赖: sudo pip install xlrd sudo pip install xlwt sudo pip install httpie
2022-10-29 01:40:44 17KB Python
1