在微博谣言检测中,对微博谣言进行正确标注需要耗费大量的人力和时间,同时数据类别的不平衡也影响了微博谣言的正确识别。为了解决该问题,提出一种基于Co-Forest算法针对不平衡数据集的改进方法,利用SMOTE算法和分层抽样平衡数据分布,并通过代价敏感的加权投票法来提高对未标记样本预测的正确率。该方法只需要对少量训练数据实例进行谣言类别标注即可有效检测谣言。10组UCI测试数据和2组微博谣言的实证实验证明了算法有效性。
1
在经典谣言传播模型的基础上,研究了社会网络上的谣言传播,并建立了数学模 型。目标是研究初始集合对谣言传播的影响。对给定的初始集合,随着时步增加,分析被 谣言传播影响的节点的概率值,并得出了有关最终集合 AS的期望值的一些结论。
2021-12-12 08:59:15 483KB 自然科学 论文
1
在线社交网络上的谣言检测研究最后一年研究项目的源代码。 抽象 这项研究旨在确定诸如Twitter和Facebook之类的在线社交网络上谣言的关键特征。 鉴于互联网作为新闻来源的普及性以及互联网上信息的不断增长,自动识别谣言的重要性正变得越来越重要。 开发了一组定性和定量指标,以更好地了解每个搜索查询的特征及其生成的结果数据集。 定量指标表明数据集的大小,而定性指标则评估数据集的新闻/谣言纯度和上下文纯度。 指标将指示数据集从数据集中剖析不同上下文所需的预处理工作量,并使其对进一步分析更加有用。 利用计算机科学和社会科学的现有文献,进行了三个实验: 数据集的总体情绪概况是什么? 在以谣言为中
2021-12-10 16:07:26 4.41MB python machine-learning twitter sentiment-analysis
1
谣言检测 谣言检测 分支 bebug-ret 正在进行
2021-12-08 09:34:54 141KB Python
1
NLP民工的乐园 最强大的NLP武器库 NLP民工的乐园:几乎最全的中文NLP资源库 词库 工具包 学习资料 在入门到熟悉NLP的过程中,用到了很多github上的包,遂整理了一下,分享在这里。 很多包非常有趣,值得收藏,满足大家的收集癖!如果觉得有用,请分享并star,谢谢! 长期不定时更新,欢迎手表和叉子! 涉及内容包括但不限于:中英文敏感词,语言检测,中外手机/电话归属​​地/运营商查询,名字,名称,性别,手机号撤回,身份证删除,邮箱删除,中日文人名库,中文缩写库,拆字字典,词汇情感值,替换词,反动词表,暴恐词表,繁简体转换,英文模拟中文最佳,汪峰歌词生成器,职业名称词库,词典库,反义词库,否定词库,汽车品牌词库,汽车零件词库,连续英语切割,各种中文词向量,公司名称大全,古诗词库,IT词库,财经词库,成语词库,地名库,历史名人词库,诗词词库,医学词库,饮食词库,法律词库,汽车词库,动
2021-11-25 15:48:32 69.21MB Python
1
学习传染病SIR模型,得优的数学建模论文,符合数学建模论文模板,强于一般资料,虽然专家论文比不上,但辅佐来看也是可以的。再强调一遍,适合数学建模萌新,强于网上的一般资源,毕竟废了好大功夫!
2021-11-02 22:07:51 380KB 数学建模 SIR模型
Detecting Rumors from Microblogs with Recurrent Neural Networks文中数据集的源数据集,其中包含谣言传播的树形结构。
2021-09-14 14:35:38 11.66MB 谣言
1
《网络安全法》视域下的网络谣言治理 AI 法律法规 法律法规 AI 解决方案
大数据时代网络谣言法律规制的困境与出路.pdf
2021-07-05 20:08:29 862KB 大数据 数据分析 数据应用 数据时代
谣言传播问题合肥工业大学数据结构,合肥工业大学数据结构课程设计
1