84168条新浪微博数据集。 8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。包含63641个用户,文件为sql脚本,可直接导入数据库。 微博数据集 话题聚类
1
Java新浪微博客户端开发第六步(完结&&开源) 详情请参看http://binary.duapp.com/?p=231 或 http://blog.csdn.net/Cannel_2020
2021-03-27 08:41:01 8.39MB Java 新浪微博 客户端 源代码
1
针对微博用户添加的标签体现了其自身特点及兴趣的情况,为探索微博用户添加标签的行为及特点,首先利用Python与Web自动化工具基于广度优先策略抓取微博用户、用户关系、微博内容、微博评论等数据,并将其存储在数据库中。其次,利用Pandas分析了微博数量的分布情况、用户添加标签的行为及内容,通过使用Matplotlib将分析结果可视化,并利用k-means算法对添加标签的用户进行了聚类分析。由此通过基于用户标签的聚类分析结果可用于个性化推荐及舆情分析等方面。
2021-03-25 14:09:27 1.54MB 微博; Python; 数据采集; 用户标签
1
文中以新浪微博为研究对象,以分析新浪微博的信息转发与传播特征为研究目的,并对传播行为进行预测.在获取大量新浪微博在线数据的基础上,对各种可能影响用户转发行为的因素进行统计、分析,挖掘各种影响因素特征并进行建模.提出基于用户属性、社交关系和微博内容三类综合特征,使用机器学习的分类方法,对给定微博的用户转发行为进行预测.基于微博网关注关系拓扑,利用概率级联模型对给定微博的转发路径进行预测,为预测微博的影响范围提供依据.文中通过实验分析了新浪微博符合复杂网络特征、社交类特征对转发行为有重要影响,并验证了传播预测的有效性.
1
新浪微博消息数据集(197810条).rar
2021-03-22 20:08:48 6.95MB 数据集 shp 矢量
新浪微博个人微博数据集(已导入).rar
2021-03-22 20:08:47 20.61MB 数据集 shp 矢量
目前新浪微博正发展的如火如荼,本文从各个方面对新浪微博和Twitter进行了对比。
2021-03-18 11:16:48 1.58MB 新浪 微博 研究报告 twitter
1
新浪微博在2014年3月公布的月活跃用户(MAU)已经达到1.43亿,2014年新年第一分钟发送的微博达808298条,如此巨大的用户规模和业务量,需要高可用(HA)、高并发访问、低延时的强大后台系统支撑。微博平台第一代架构为LAMP架构,数据库使用的是MyIsam,后台用的是php,缓存为Memcache。随着应用规模的增长,衍生出的第二代架构对业务功能进行了模块化、服务化和组件化,后台系统从php替换为Java,逐渐形成SOA架构,在很长一段时间支撑了微博平台的业务发展。在此基础上又经过长时间的重构、线上运行、思索与沉淀,平台形成了第三代架构体系。我们先看一张微博的核心业务图(如下),是不
2021-02-21 09:08:14 284KB 亿级用户下的新浪微博平台架构
1
自述文件 为了方便第三方开发者快速集成微博SDK,我们提供了以下联系方式,协助开发者进行集成: QQ群:453830884(iOS请加此群) 226214250(此群已满) 263989257(此群已满) 284084420(此群已满)邮箱: 微博:移动新技术另外,关于SDK的错误反馈,用户体验,以及好的建议,请大家尝试提交到Github上,我们会尽快解决。目前,我们正在逐步完善微博SDK,有望为第三方开发者提供一个规范,简单易用,可靠,可扩展,可定制的SDK,敬请期待。 概述 微博iOS平台SDK为第三方应用提供了简单易用的微博API调用服务,使第三方客户端无需了解复杂的验证机制即可进行授权登陆,并提供微博分享功能,可直接通过微博官方客户端分享微博。 #快速集成WeiboSDK支持使用Cocoapods集成,请在Podfile中添加以下语句: pod "Weibo_SDK", :gi
2021-02-19 21:07:32 19.08MB HTML
1
该爬虫属于本人2015新作,虽然尚有不足,却具有爬虫的基本雏形,望借鉴 该爬虫属于本人2015新作,虽然尚有不足,却具有爬虫的基本雏形,望借鉴
2021-02-10 10:01:52 36KB 新浪 微博 网络爬虫 Jsoup
1