一个高质量的海量数据集,共包含6大类20个细粒度要素的情感倾向。含有训练集、验证集和测试集
2019-12-21 19:28:12 51.3MB 情感分析
1
基于情感词典的中文微博情感倾向分析研究_陈晓东——华中科技大学
2019-12-21 19:27:56 721KB 情感分析
1
程序为Python代码编写,本人为程序配置了详细的博客解析,详见http://blog.csdn.net/bcj296050240/article/details/46686797
2019-12-21 19:27:56 198KB 情感分析
1
用python实现基于情感词典的情感分析 大数据分析
2019-12-21 19:27:49 141KB python 情感词典 情感分析
1
目前最全的中文情感词典,包括以下内容: 1. 褒贬词及其近义词; 2. 汉语情感词极值表; 3. 清华大学李军中文褒贬义词典; 4. 情感词典及其分类; 5. 情感词汇本体; 6. 台湾大学NTUSD简体中文情感词典; 7. 知网Hownet情感词典。
2019-12-21 19:22:31 1.6MB 情感词典 语义词典 情感分析
1
爬虫获取的豆瓣电影短评,仅包含电影名,用户名,日期,评分,短评内容
2019-12-21 19:22:13 16.57MB 豆瓣电影 短评 情感分析 数据集
1
带积极消极标签,内容未进行清洗,主要用于机器学习情感分析
2019-12-21 19:22:13 8.26MB 机器学习 情感分析 数据集 推特
1
为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2.ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3.ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4.ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。
2019-12-21 18:58:03 3.81MB 中文情感分析 酒店评论预料
1
csv格式,斯坦福大学收集的评论情感分析数据集,比较齐全,好用。
2019-12-21 18:58:02 77.59MB 情感分析
1
# 语料库说明 ------------------------------------------------------------------------ ## 词典 1、HowNet 情感词典 2、ntusd 情感词典 3、情感分析停用词表 4、结巴分词自定义词典 5、常用语词典,包括流行新词,网络流行词,手机词汇,粤语,潮语潮词、阿里巴巴-通讯产品词汇等 ## 手机评论数据 1、HTC手机评论,包括打分,共302篇1-5 2、魅族手机评论,包括打分,共529篇1-5 3、诺基亚手机评论,包括打分,共614篇1-5 4、OPPO手机评论,包括打分1-5,共553篇 5、三星手机评论,包括打分1-5,共762篇 6、中兴手机评论,包括打分1-5,共785篇 7、摩托罗拉手机评论,包括打分1-5,共990篇 8、整合:正面评论1084篇,负面评论524篇 ## 淘宝商品评论数据 1、正面评论一万篇,负面评论一万篇 2、待预测的语料一万篇 ## 2012微博情感分析数据 共三个任务,数据集来自腾讯微博,每个话题1,000条,总约两万条微博 1、观点句与非观点句的判别 2、情感分类 3、情感要素抽取 ## 谭松波酒店评论语料 正负样本不平衡,正样本7,000,负样本3000,共10,000. ## 酒店、服装、水果、平板、洗发水 正负样本均5,000,总样本数50,000
2019-12-21 18:57:42 12.81MB 中文语料 情感分析 数据集
1