酒店系统java源码-Sentiment-Analysis:爬取商品评论并对商品评论进行情感分类

上传者: 38742291 | 上传时间: 2022-05-15 16:43:44 | 文件大小: 69.85MB | 文件类型: ZIP
酒店系统java源码 Sentiment-Analysis 本项目主要内容说明 本项目是基于java实现的本科毕设。首先从亚马逊中文网站爬取了关于“手机”的评论,然后对其进行情感分类。使用用户标记的星级作为情感类别,将这些评论分为了3类(与星级对应关系为1-{1,2},2-{3},3-{4,5})和5类(与星级一一对应)。预处理包括字符处理(包括全角转半角、过滤无关符号,主要为了避免特征稀疏)以及发现新词、分词、删除停用词,使用的主要分类方法是朴素贝叶斯,特征选择方法包括信息增益(Information Gain,IG)和文档频率(Document Frequency,DF)以及它们的结合。 分类效果:对亚马逊评论三分类F1值效果为 79.72%, 五分类效果为 63.63%。为了进一步检验,使用本文分类器对tanh松波酒店评论进行二分类,使用信息增益筛选特征,最好情况下, precision、 recall、 F1 值分别达到了 85.89%、 82.33%、 84.07%. 本项目又进一步增加了卡方统计和互信息的特征选择方法,并进行了对比分析。以此为基础,在《计算机应用》发表了。并

文件下载

资源详情

[{"title":"( 222 个子文件 69.85MB ) 酒店系统java源码-Sentiment-Analysis:爬取商品评论并对商品评论进行情感分类","children":[{"title":"删除DF.txt <span style='color:#111;'> 31.72KB </span>","children":null,"spread":false},{"title":"tan.xls <span style='color:#111;'> 2.46MB </span>","children":null,"spread":false},{"title":"结果4.txt <span style='color:#111;'> 28.12KB </span>","children":null,"spread":false},{"title":".project <span style='color:#111;'> 369B </span>","children":null,"spread":false},{"title":".gitattributes <span style='color:#111;'> 378B </span>","children":null,"spread":false},{"title":"......","children":null,"spread":false},{"title":"<span style='color:steelblue;'>文件过多,未全部展示</span>","children":null,"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明