中文微博情感数据库(2分类数据集) 带情感标注的微博语料数量: 10000(train.txt)+500(test.txt) 数据格式: 文档的每一行代表一条语料 每条语料的第一个数据为微博对应的mid,是每条微博的唯一标签,可以通过"https://m.weibo.cn/status/" + mid 访问到该条微博的网页(部分微博可能已被博主删除) 第二个数据为情感标签, 0表示负面, 1表示正面 其余后面部分都是微博文本 微博表情都被转义成[xx]的格式, 如: avatar被标记为[doge] avatar被标记为[允悲] 微博话题/地理定位/视频、文本超链接等都转义成了{%xxxx%}的格式,使用正则可以很方便地将其清洗
2024-02-03 19:51:46 1.73MB 数据集 情感分析
1
CASIA汉语情感语料库由中国科学院自动化所(Institute of Automation, Chinese Academy of Sciences)录制,共包括四个专业发音人,六种情绪生气(angry)、高兴(happy)、害怕(fear)、悲伤(sad)、惊讶(surprise)和中性(neutral),共9600句不同发音。其中300句是相同文本的,也即是说对相同的文本赋以不同的情感来阅读,这些语料可以用来对比分析不同情感状态下的声学及韵律表现;另外100句是不同文本的,这些文本从字面意思就可以看出其情感归属,便于录音人更准确地表现出情感。我们选取300句相同文本的音频作为实验数据,取前200句为训练集,后100句为测试集。实验同样对数据集进行了切分处理。
2021-05-17 14:08:56 56.01MB 情感数据库
1
整理的几种语音情感数据集,包括CASIA汉语库、Berlin Database和 IEMOCAP。
2020-01-12 03:01:35 95.34MB 音情感数据集
1
这是柏林语音情感数据库完整版,包括音频和标签,适合从事语音识别的研究者进行语音情感识别。
2019-12-21 19:41:35 32.16MB 情感数据库 EMO-DB
1