中文微博语料库2014.包含COAE2014会议五个任务的评测数据,任务1 :面向新闻的情感关键句抽取与判定 在给定新闻集合(每篇文章已切成句子)中,判别每篇文章的情感关键句 。 任务2:跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集 ,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3:微博情感新词发现与判定 本任务是对给定大规模的微博句子集 ,要求参赛系统自动发现新的词语( 不在给定的词典以内),以及每个词语的情感倾向性,即褒义、贬义或者中性。 任务4:微博观点句识别 在给定的微博句子集合中,判别每个句子的情感倾向性。
2021-10-16 14:58:14 42.25MB nlp sentiment an
1
COAE2014,2013部分语料数据
2020-01-03 11:25:53 20.8MB COAE数据
1
COAE2015数据集,用做简单的机器学习情感分析的训练集很不错
2019-12-21 20:41:19 1.85MB COAE
1
COAE2008数据集,4万篇中文文档.数据来源于一个语料分类比赛.    语料规模接近40000篇。其中至少包括4000余篇情感文本,这些情感文本均采用手工标注。参赛者只需下载压缩包并解压后即可使用。语料中大致含有两种编码:即GB2312,Unicode(UTF-8)编码。可以正常用写字板打开的是GB2312,显示为乱码的为Unicode(UTF-8)编码。
2019-12-21 20:00:24 11.46MB COAE 2008 4K 情感倾向
1