针对私人微博内容进行聚类研究,结合私人微博的内容和结构特点提出了基于K-means的改进聚类算法。通过添加引用和评论内容丰富了文本内容,降低了短文本矩阵向量严重稀疏性带来的聚类算法准确性降低的影响;通过甄别“微话题”内容和改进相似度的计算,找到初始化类别并进行初步计算得到合适的类别数目和初始中心点,解决了K-means算法中聚类数目K需人工指定和初始中心点选取随机性的问题。实验结果表明,改进后的算法不仅可以自适应地得到K值,较普通的K-means算法在聚类的准确率上有所提高。
2023-04-01 22:52:14 306KB k-means算法
1
随着微博用户的迅猛增长,越来越多的人希望从用户的行为和微博内容中挖掘有趣的模式。针对如何对微博数据进行有效合理的采集,提出了基于微博API的分布式抓取技术,通过模拟微博登录自动授权,合理控制API的调用频次,结合任务分配控制器高效地获取微博数据。该分布式抓取技术还结合时间触发和内存数据库技术实现重复控制,避免了数据的重复爬取和重复存储,提高了系统的性能。本分布式抓取技术具有可扩展性高、任务分配明确、效率高、多种爬取策略适应不同的爬取需求等特点。新浪微博数据爬取实例验证了该技术的可行性。
2023-03-27 15:11:13 1.92MB 新浪微博 爬取策略 分布式爬取 微博API
1
新浪微博的语义资料。
2023-03-26 14:43:14 667KB 新浪 语义消歧资料
1
随着网络的飞速发展,微博逐渐成为社交网络中信息传播及信息收集的重要平台,微博转发是微博信息传播的重要途径,研究微博转发问题对微博信息传播、微博营销、舆情监控有着极其重要的意义.影响微博转发的主要因素有:粉丝兴趣与微博文本的相似度,微博营销策略及用户粉丝数量的变化.以往的预测模型没有综合考虑这两方面因素,基于此,提出了一种基于循环神经网络的方法来对微博转发量级进行预测,首先利用SIM-LSTM模型构建微博转发趋势度,然后再利用TF-IDF构建粉丝兴趣和微博文本的相似度,最后通过神经网络模型来预测粉丝是否会转发该微博.实验结果表明本文提出的算法相对于其他预测算法F1评估值提高了近5%.
1
python3.7 使用requests库模拟新浪微博登录。由于新浪对于用户账号和密码使用特殊加密,此程序使用base64对用户名进行编码和rsa2对password进行编码,亲测完成登录。
2023-03-25 13:08:06 6KB login
1
基于BA无标度网络模型,融合微博用户网络的特征,构造一种微博谣言传播网络模型。提出一种新的SIR(susceptible-infected-removed)模型,通过数值仿真探讨微博谣言的传播动力学行为。研究表明,当微博用户规模以及节点间新建连接数量不断增大时,微博谣言的最终感染程度显著增大,网络的传播临界值却大幅降低。研究还发现,拥有较大吸引度的节点比例以及微博用户之间添加反向关注的概率基本不影响谣言的传播特性。
2023-03-22 13:49:22 356KB 无标度网络
1
微博用户影响力分析作为社交网络分析的重要组成部分,一直受到研究人员的关注。针对现有研究工作分析用户行为时间性的不足和忽略用户与参与话题之间关联性等问题,提出了一种面向微博话题的用户影响力分析算法——基于话题和传播能力的用户排序(TSRank)算法。
2023-03-17 15:23:08 1.25MB 微博话题
1
以微博为代表的社交平台是信息时代人们必不可少的交流工具.挖掘微博文本数据中的信息对自动问答、舆情分析等应用研究都具有重要意义.短文本数据的分类研究是短文本数据挖掘的基础.基于神经网络的Word2vec模型能很好的解决传统的文本分类方法无法解决的高维稀疏和语义鸿沟的问题.本文首先基于Word2vec模型得到词向量,然后将类别因素引入传统权重计算方法TF-IDF (Term Frequency-Inverse Document Frequency)设计词向量权重,进而用加权求和的方法得到短文本向量,最后用SVM分类器对短文本做分类训练并且通过微博数据实验验证了该方法的有效性.
2023-03-16 16:35:47 977KB Word2Vec 短文本分类 TF-IDF
1
1000个男头像微信头像QQ头像微博头网络头像真实头像压缩包,共大吉下载。图片来自网络,侵权请留言
2023-03-14 15:24:13 8.63MB 头像 男头像 网络头像 微信头像
1
基于安卓Android的新浪微博系统毕业课程设计源码:实现了微博信息的展示,发送微博,发布评论,显示好友信息等! 基于安卓Android的新浪微博系统毕业课程设计源码:实现了微博信息的展示,发送微博,发布评论,显示好友信息等!
2023-03-13 22:27:04 8.45MB 安卓 移动开发 毕业设计 课程设计
1