微博用户影响力分析作为社交网络分析的重要组成部分,一直受到研究人员的关注。针对现有研究工作分析用户行为时间性的不足和忽略用户与参与话题之间关联性等问题,提出了一种面向微博话题的用户影响力分析算法——基于话题和传播能力的用户排序(TSRank)算法。
2023-03-17 15:23:08 1.25MB 微博话题
1
爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章爬取微博话题和文章
2022-01-18 21:59:14 3KB 微博 爬虫 python
1
基于LDA模型的微博话题检测,汪进祥,刘念,随着微博用户的不断增长,国外的Twitter和国内的新浪微博已经成为媒体和个人发布信息的重要平台.对于微博这种特殊的文本,通常小于140��
2022-01-03 13:56:22 376KB 主题模型
1
基于微博话题评论的情感分析研究与应用,基于微博话题评论的情感分析研究与应用
2021-12-24 07:06:59 3.3MB 情感分析
1
功能 连续获取一个或多个微博关键词搜索结果,并将结果写入文件(可选),数据库(可选)等所谓微博关键词搜索即:搜索正文中包含指定关键词的微博,可以指定搜索的时间范围。举个栗子,通常您可以搜索包含关键字“迪丽热巴”且发布日期在2020-03-01和2020-03-16之间的微博。搜索结果数量巨大,对于非常热门的关键字,在一天的指定时间范围内,可以获得1000万以上的搜索结果。注意这里的一天指的是时间筛选范围,具体多连续将这1000万微博下载到本地还要看获取的速度。1000万只是一天时间范围可获取的微博数量,如果想获取更多微博,可以增加时间范围,比如10天,最多可获得1000万X10 = 1亿条搜索结果,当然你也可以再加大时间范围。对于大多数关键字,微博一天产生的相关搜索结果应该低于1000万,因此可以说本程序可以获取指定关键字的全部或近似全部的搜索结果。 ,如微博正文,发布者等,详情见部分。支
2021-09-30 18:49:18 21KB Python
1
随着微博用户的增多,微博平台的信息更新频繁。针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题。采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能有效地发现话题。实验表明该算法较传统文本聚类算法的综合指标F值有明显提高。
1
针对传统话题检测方法在微博短文本上存在高维稀疏的缺陷,提出了一种基于特征融合的K-means微博话题发现模型。为了更好地表达微博话题的语义信息,使用在句子中共现的词对向量模型(Biterm_VSM)代替传统的向量空间模型(Vector Space Model,VSM),并结合主题模型(Latent Dirichlet Allocation,LDA)挖掘出微博短文本中的潜在语义,把两个模型得到的特征进行特征融合,并应用K-means聚类算法进行话题的发现。实验结果表明,与传统的话题检测方法相比,该模型的调整兰德系数(Adjusted Rand index,ARI)为0.80,比传统的话题检测方法提高了3%~6%。
2021-05-14 09:30:34 490KB 话题检测
1
Android 自定义view-仿新浪微博#话题#插入EditText 博客地址http://blog.csdn.net/u014702653/article/details/52799715
2019-12-21 21:31:08 2.68MB EditText
1