本宝宝采集的豆瓣20万条影评原始数据集,希望大家积极下载,尊重宝宝的劳动成果,后期有时间我还为大家提供数据集哈。 机器学习,nlp,深度学习的宝宝赶快看过来,看过来哈。 数据集格式: title##star##comment 电影名称##评论星级(1-5星)##评论内容
2021-07-15 21:45:58 19.93MB nlp 情感分析 豆瓣影评 影评数据
1
情感分析旨在分类出文本在不同方面的情感倾向。在长文本的方面级情感分析中,由于长文本存在一定冗余性和噪声大的问题,导致现有的方面级情感分析方法对于长文本中方面相关信息的特征提取不够充分,分类不精准;在方面分层为粗粒度和细粒度方面的数据集上,现有的解决方法没有利用粗粒度方面中的信息。针对以上问题,提出基于文本筛选和改进BERT的算法TFN+BERT-Pair-ATT。该算法首先利用长短时记忆网络(LSTM)和注意力机制相结合的文本筛选网络(TFN)从长文本中直接筛选出与粗粒度方面相关的部分语句,然后将部分语句按次序进行组合,并结合细粒度方面输入至在BERT上增加注意力层的BERT-Pair-ATT中进行特征提取,最后使用Softmax进行情感分类。通过与GCAE(Gated Convolutional Network with Aspect Embedding)、IAN(Interactive Attention Network)等经典模型相比,该算法在验证集上的相关评价指标分别提高了3. 66%和4. 59%;与原始BERT模型相比提高了0. 58%。
2021-07-15 15:09:52 807KB BERT
1
多个情感辞典。 褒义词 近义词 贬义词 知网Hownet情感词典 台湾大学NTUSD简体中文情感词典
2021-07-15 10:05:50 1.65MB 情感分析词库
1
个人网站:https://www.zhangjunbk.com 网上购买最全的中文情感词典,包括以下内容: 1. 褒贬词及其近义词; 2. 汉语情感词极值表; 3. 清华大学李军中文褒贬义词典; 4. 情感词典及其分类; 5. 情感词汇本体; 6. 台湾大学NTUSD简体中文情感词典; 7. 知网Hownet情感词典。
2021-07-13 21:20:11 1.56MB 词典下载 情感分析 语义词典 人工智能
1
这是中文电影评论数据集,数据集还算大,大型模型可以用,小型模型使用一部分,所以也可以。数据集的质量挺高的。
2021-07-10 13:05:49 81.72MB 情感分析
1
1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2.ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3.ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4.ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。
2021-07-10 12:02:59 3.81MB 情感分析 训练集 情感挖掘 酒店评论
1
中文停用词表, 哈工大停用词表, 百度停用词表, 四川大学机器智能实验室停用词库四份停用词表进行了合并去重
2021-07-10 09:10:01 16KB 数据分析 jieba分词 情感分析
1
列举出常用的汉字3550个,还有生僻字
2021-07-10 09:10:01 12KB jieba分词 评论分析 情感分析
1
文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.
2021-07-09 21:38:50 551KB 自然语言处理 机器学习 数据挖掘
1
谭松波整理的中文酒店评论语料。数据规模有10000篇,每条评论已经标注好情感方向。适合当作中文情感分析的语料库。
2021-07-09 11:39:40 9.94MB 中文情感分析
1