根据评论内容的特性, 提出了一种基于主题-对立情感依赖模型( to p ic -o pp ositesentimentde p endenc ymod -el , TOSDM) 的虚假评论检测方法。首先构建 TOSDM 模型, 利用该模型提取评论的主题信息以及主题对应的情感信息; 然后结合评论的主题以及情感信息, 分析并提 取6维 评 论 内 容 特 征; 最 后 利 用 这 些 评 论 内 容 特 征, 采 用 有 监督学习的分类器对虚假评论进行检 测。在 大 众 点 评 网 获 取 的2009 -2012年 的5个 领 域 的 评 论 数 据 集 上 进 行 了 实验, 实验表明, 提取评论主题信息以及主题对立情感信息能够提高虚假评论的检测效果, TOSDM 的虚假 评 论 检 测效果优于其他模型。
1
微信爬虫 以下为部署文档 技术文档请查看: 逆向方式抓取的方案请查看: 功能: 检测公众号每日新发文章 抓取公众号信息 抓取文章列表 抓取文章信息 抓取阅读量、点赞量、评论量 抓取评论信息 临时链接转永久链接 打包好的执行文件下载地址 链接: 密码: qnk6 特色: 免安装:支持mac、window,双击软件即可执行 自动化:只需要配置好待监控的公众号列表,启动软件后即可每日自动抓取公众号及文章等信息 好对接:抓取到的数据使用mysql存储,方便处理数据 不漏采:采用任务状态标记的方式,防止遗漏每一个公众号、每一篇文章 分布式:支持多个微信号同时采集,微信客户端支持Android、iphone、Mac、Window 全平台 数据示例 1. 公众号数据 2. 文章列表数据 3. 文章数据 4. 阅读点赞评论数据 5. 评论数据 所需环境 mysql:用来存储抓取到的数据以
2021-10-08 11:52:24 3.15MB Python
1
对应https://gist.github.com/kunalj101/ad1d9c58d338e20d09ff26bcc06c4235
2021-08-20 01:24:53 4.3MB 数据集
1
景区评论_内含日期,景区,评论内容属性.xlsx
2021-06-29 10:01:34 4.23MB 数据挖掘 中文情感分析
1