关于微博用户特征分析和核心用户挖掘的一份ppt,包含行为关联分析、社区划分 、普通用户挖掘、微博名人挖掘等四部分的简介。
2023-04-13 09:48:14 40KB 微博 用户
1
使用python+scrapy爬取新浪微博的用户基本资料、关注和粉丝
2023-03-01 09:32:20 27KB Spider Python
1
在已有 Pagerank算法构建的微博用户影响力评估模型中,存在用户自身属性信息欠缺以及在用户不活跃期间其影响力被误判下降的问题。为此,综合考虑用户自身的属性,基于用户的活跃度、认证信息及博文质量来确定其自身的基本影响力,通过引入用户博文的传播率挖掘用户的潜在影响力,结合用户不同好友的质量,基于改进的 Pagerank算法构建微博用户影响力评估算法。实验结果表明,与改进BWPR算法相比,该算法准确率、召回率和F值分别提高13.5%、10.1%和12.3%,能准确、客观地反映微搏用户的实际影响力,可为社交网络中的意见领袖挖掘、信息传播和舆论引导等研究提供参考。
2022-08-29 18:55:10 1.66MB 网络多媒体算法
1
将个人微博用户关系网络作为研究对象,抓取了一个用户从开始注册到一定稳定期3个时间点的数据,构建了3个复杂网络,研究了该微博用户关系网络的结构属性变化,得出用户行为和影响力的变化。使用K
2022-07-02 22:17:35 870KB 自然科学 论文
1
在微博世界中,微博意见领袖对微博中舆论的导向发挥着重要的作用,因此,研究微博意见领袖的分析与挖掘方法十分必要。探讨了微博用户网络中意见领袖的分析与挖掘方法,构建了微博意见领袖的特征指标体系,采用层次分析法(Analytic Hierarchy Process,APH)给出了各特征指标的权重计算方法,从而提出了用户初始影响力的计算模型。在此基础上,借鉴PageRank算法思想,提出了用户初始影响力扩散的计算模型,实现了微博用户影响力的定量化度量,为意见领袖的分析确定提供了充分的依据。实验数据表明,所提出的微博意见领袖的分析与挖掘方法是非常有效的。
1
为了充分考虑微博的跨领域与领域交叉性特点,提出了基于领域的微博用户影响力的计算方法.该方法依据用户的微博内容与ODP领域本体的相似度,通过KNN领域分类算法判别微博所属的领域;并根据用户的粉丝数、被提及数、被评论数、在线时间与注册时间、微博的转发数等参数运用影响力计算公式分别计算用户在各领域的影响力,从而确定微博用户在各领域的影响力大小.实验表明,本文的计算方法充分考虑了微博的跨领域性与领域交叉性特点,并能更好地计算用户在各领域的影响力大小.
2022-04-27 20:06:53 2.45MB 自然科学 论文
1
网页排名 使用PageRank计算微博用户的重要性。 从获取更多。
2022-03-21 10:37:03 5KB Java
1
作为爬虫小白,代码偏向简单,大佬勿喷~ 本次使用语言:Python 本次使用库:requests、wordcloud、jieba 思路 通过尝试,在网页版微博死活找不出文本url(可能是能力有限),在移动端微博找到了,所以推荐大家爬取移动端微博数据。 移动端微博网址:https://m.weibo.cn/ 1.此次爬取的是“方方”的文本,进入开发者模式,找到名为”getIndex…“的接口。可以看到Preview里有id和text。 2.进入此url,发现没有中文text,对此疑惑不解。搜索id发现有多个匹配,推断id为微博的编号。 此外,在url后加上”&page=”可以实现翻页。 3.
2022-02-27 20:56:55 1.04MB 实战 数据 爬虫
1
新浪公共数据集 包括 微博ID 用户ID 微博内容
2022-01-15 21:03:46 2.74MB 数据集 新浪 微博 用户数据
1
百万条微博信息,包括微博粉丝关注列表&&微博用户基本信息表&&微博转发评论列表,仅提供研究实验所用。
2021-12-27 15:22:30 218.52MB 微博信息
1