只为小站
首页
域名查询
文件下载
登录
基于Python的豆瓣图书评论数据获取与可视化分析.pdf
基于Python的豆瓣图书评论数据获取与可视化分析.pdf
2021-12-10 19:50:46
942KB
Python
程序
数据处理
专业指导
Python实现爬取并分析电商评论
现如今各种APP、微信订阅号、微博、购物网站等网站都允许用户发表一些个人看法、意见、态度、评价、立场等信息。针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息。例如对商品评论的分析,可以了解用户对商品的满意度,进而改进产品;通过对一个人分布内容的分析,了解他的情绪变化,哪种情绪多,哪种情绪少,进而分析他的性格。怎样知道哪些评论是正面的,哪些评论是负面的呢?正面评价的概率是多少呢? 利用python的第三方模块SnowNLP可以实现对评论内容的情感分析预测,SnowNLP可以方便的处理中文文本内容,如中文分词、词性标注、情感分析、文本分类、提取文本关键词、文本相似度计
2021-12-09 18:46:07
160KB
电商
1
美国视频游戏销售和评价数据数据集
美国视频游戏销售和评价数据
2021-12-09 02:56:48
503KB
商品销售
商品零售
Kaggle
商品评价
商品评论
1
少年的你评论数据分析.zip
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
2021-12-08 22:18:38
267KB
数据分析
1
基于主题-对立情感依赖模型的虚假评论检测方法
根据评论内容的特性, 提出了一种基于主题-对立情感依赖模型( to p ic -o pp ositesentimentde p endenc ymod -el , TOSDM) 的虚假评论检测方法。首先构建 TOSDM 模型, 利用该模型提取评论的主题信息以及主题对应的情感信息; 然后结合评论的主题以及情感信息, 分析并提 取6维 评 论 内 容 特 征; 最 后 利 用 这 些 评 论 内 容 特 征, 采 用 有 监督学习的分类器对虚假评论进行检 测。在 大 众 点 评 网 获 取 的2009 -2012年 的5个 领 域 的 评 论 数 据 集 上 进 行 了 实验, 实验表明, 提取评论主题信息以及主题对立情感信息能够提高虚假评论的检测效果, TOSDM 的虚假 评 论 检 测效果优于其他模型。
2021-12-08 16:10:34
509KB
评论内容;
虚假评论;
评论挖掘;
主题-对立情感依赖模型(
1
基于半监督主动学习的虚假评论检测
基于有监督的虚假评论检测方法受限于标注语料的规模,为了更好地利用未标注评论数据来提高分类器的正确率和泛化能力,本文提出一种基于半监督主动学习的虚假评论检测方法。首先,定义并提取评论内容特征以及评论者行为特征,结合这两类特征来对虚假评论进行检测。然后,采用基于熵的主动学习算法选择对学习最有帮助的评论样本,获得其类别标注,将其合并到基于Tri-training的半监督学习算法的训练集中,利用大量未标注评论数据进行学习,提升分类器性能。最后,在领域评论数据集上进行实验,结果表明,将半监督学习与主动学习相结合,能够更有效的利用未标注评论数据,从而有效地提高虚假评论检测的效果。
2021-12-08 16:10:25
378KB
虚假评论;半监督学习;主动学习;Tri-training
1
aclImdb_v1 大型电影评论数据集-数据集
AclImdb – v1 Dataset 是用于二进制情绪分类的大型电影评论数据集,其中有 25,000 条电影评论用于训练,25,000 条用于测试,还有其他未经标记的数据可供使用,该数据集包含原始文本和已处理的单词格式包。 aclImdb_v1 大型电影评论数据集_datasets.txt aclImdb_v1 大型电影评论数据集_datasets.zip
2021-12-08 15:10:00
98.82MB
数据集
1
如何基于Python爬取隐秘的角落评论
主要介绍了如何基于Python爬取隐秘的角落评论,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2021-12-07 15:36:22
612KB
Python
爬取
隐秘的角落
评论
1
film_review_project:使用Python和MongoDB的电影评论网站-源码
用户体验(UX) 用户故事 网站所有者目标 设计 线框 特征 使用的技术 使用的语言 使用的框架,库和程序 测验 虫子 修正错误 已知错误 部署方式 学分 致谢
2021-12-06 16:08:21
882KB
HTML
1
DataScienceAssignment:数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图-源码
数据科学大作业 具体内容见pdf 只要把爬虫文件里的cookie换成你的应该就跑的起来 当然还要改日期和关键词
2021-12-06 10:22:13
93.19MB
HTML
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
SSM外文文献和翻译(毕设论文精品).doc
MTALAB NSGA2算法
Plex v7.12电视端app
科研伦理与学术规范 期末考试2 (40题).pdf
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
校园网规划与设计和pkt文件
多智能体的编队控制matlab程序(自己编写的,可以运行)
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
IEEE33节点配电网Simulink模型.rar
基于ray filter的雷达点云地面过滤ROS节点
基于yolov4-keras的抽烟检测(源码+数据集)
python实现的学生信息管理系统—GUI界面版
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
拾荒者扫描器.zip
最新下载
ibm_mkt_V2_win_unix及文档.rar
PS2251-09(PS2309)量产工具,本人实测可用,附配置教程
tsmc18rf工艺包(免安装OA格式)
fft_ifft_test.zip
奇迹客户端模型查看软件 MUModelView0.02
金山打字通2000.rar
黑莓9930能用的软件
黑莓9930所有好用的程序和COD,SB实测好用
ILSVRC_2017.tar.gz
金税盘时钟校对失效环境检测工具EnvTestTool
其他资源
整理的用Python编写的爬虫文档
嵌入式系统构件+第2版+中文pdf+英文pdf+源码
python经典100例编程.zip
截图工具(仿QQ截图,大致功能都已实现)
OpenGL大规模地形渲染(八叉树实现)
SOLIDWORKS Electrical3D德力西元件
redis windows C++客户端例子
图书馆管理系统java+mysql
杨淑英版《电力系统分析复习指导与习题精编》
一个好用的Outlook ost格式文件转pst文件的工具
整理C++实现excel和wps表格读写
c实训报告(简单的银行管理系统)
SpiderWebView.zip
TestDesigeMode.zip
kibana-5.6.4-linux-x86_64.tar.gz
IPP6.0 的中文简体说明书
ZYNQ7021 串口UART0
综合组网实验
dlt645-2007电能表协议解析源码+串口编程源码
任何文件增大工具
avr—usb应用,vc上位机读avr数据,程序和应用现成的,工程完好。
VB源码考试系统
GS+统计软件
易买网WEB项目SSH框架
简易数字电压表的设计