自然语言处理、 文本挖掘、 数据格式 TEXT 数据介绍 为了弥补国内在中文情感挖掘方面的语料的匮乏 谭松波 收集整理了一个较大规模的酒店评论语料
2022-12-09 11:44:14 775KB nlp 机器学习
1
谭松波--酒店评论语料.rar
2021-12-22 18:05:02 9.88MB
1
现在网上大部分谭松波老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论
2021-12-20 11:31:08 9.89MB 酒店评论语料
1
谭松波老师收集整理的酒店评论语料,一共有6000条评价预料,其中包含负面的3000条保存在neg文件夹中、正面的3000条保存在pos文件夹中。语料数据来源网络,如有侵权,请联系删除。再次感谢谭松波老师花费时间和心血收集整理并分类酒店评论语料
2021-11-16 21:47:50 1.52MB 数据集
1
现在网上大部分谭老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论
2021-08-20 23:20:30 9.89MB 酒店评论语料
1
谭松波整理的中文酒店评论语料。数据规模有10000篇,每条评论已经标注好情感方向。适合当作中文情感分析的语料库。
2021-07-09 11:39:40 9.94MB 中文情感分析
1
现在网上大部分谭松波老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论
2021-05-23 13:02:37 9.89MB 酒店评论语料
1
中文情感挖掘酒店评论语料,有2000,条,4000条,6000条,10000条四种
2021-05-11 12:13:28 3.81MB 评论语料
1
现在网上大部分谭松波老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论
2021-05-10 11:14:50 9.89MB 酒店评论语料
1
这是从东方财富网,平安银行股吧爬取的股吧评论数据,包括发言人author,发言人的影响力power,发言人的吧龄age,阅读量,评论量,还有帖子内容,可以用于构建词典,或者构建舆情指数,训练nlp模型。
2021-05-07 20:34:26 2.46MB 股吧语料 爬虫 东方财富 舆情
1