这是覃建波老师的酒店评论数据集,是公认的情感分析语料数据,做中文自然语言处理情感分析所用。
2019-12-21 21:22:23 3.81MB 情感分析
1
深度学习,中文情感分析python程序,包含中文酒店用户评论语料数据。
2019-12-21 20:24:22 3.14MB python 深度学习 中文情感分析
1
用于舆情系统,可以直接拿来算分使用
2019-12-21 20:18:33 366KB 情感分析 词库
1
基于SVM中文情感分析研究,分析的很好,详细介绍了实验的过程,很有价值
2019-12-21 20:10:32 1.91MB SVM 中文
1
说明:谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1. ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2. ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3. ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4. ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。
2019-12-21 19:58:27 6.28MB 中文情感分析 ChnSen
1
短文本情感分析语料,某外卖平台收集的用户评价,正负各8000条,共16000条
2019-12-21 19:36:36 386KB 中文情感分析 语料 短文本分类 NLP
1
为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2.ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3.ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4.ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。
2019-12-21 18:58:03 3.81MB 中文情感分析 酒店评论预料
1
# 语料库说明 ------------------------------------------------------------------------ ## 词典 1、HowNet 情感词典 2、ntusd 情感词典 3、情感分析停用词表 4、结巴分词自定义词典 5、常用语词典,包括流行新词,网络流行词,手机词汇,粤语,潮语潮词、阿里巴巴-通讯产品词汇等 ## 手机评论数据 1、HTC手机评论,包括打分,共302篇1-5 2、魅族手机评论,包括打分,共529篇1-5 3、诺基亚手机评论,包括打分,共614篇1-5 4、OPPO手机评论,包括打分1-5,共553篇 5、三星手机评论,包括打分1-5,共762篇 6、中兴手机评论,包括打分1-5,共785篇 7、摩托罗拉手机评论,包括打分1-5,共990篇 8、整合:正面评论1084篇,负面评论524篇 ## 淘宝商品评论数据 1、正面评论一万篇,负面评论一万篇 2、待预测的语料一万篇 ## 2012微博情感分析数据 共三个任务,数据集来自腾讯微博,每个话题1,000条,总约两万条微博 1、观点句与非观点句的判别 2、情感分类 3、情感要素抽取 ## 谭松波酒店评论语料 正负样本不平衡,正样本7,000,负样本3000,共10,000. ## 酒店、服装、水果、平板、洗发水 正负样本均5,000,总样本数50,000
2019-12-21 18:57:42 12.81MB 中文语料 情感分析 数据集
1
中文情感分析语料库,包含 酒店、服装、水果、平板、洗发水 等 5 个领域的评价数据,每个领域各包含 5000 条正面和负面评价,数据抓取于 携程网 和 京东 ,仅供科研学习之用,欢迎下载使用!
2019-12-21 18:55:23 2.21MB 语料库
1
可以用于研究自然语言处理,情感分析等课题,训练模型等用途
2019-12-21 18:48:40 27.15MB 情感分析 训练模型 数据集 微博
1