NLPCC2014情感分类语料集+已经标注好+中文,主要是够购物相关的评论。
2019-12-21 20:53:19 10.71MB 情感分析 正负面 语料集
1
这是从东方财富网,平安银行股吧爬取的股吧评论数据,包括发言人author,发言人的影响力power,发言人的吧龄age,阅读量,评论量,还有帖子内容,可以用于构建词典,或者构建舆情指数,训练nlp模型。
2019-12-21 20:51:11 6.18MB 股吧语料 爬虫 东方财富 舆情
1
ace_multilang_tr中的其中一个文件,从LDC上面下载下来
2019-12-21 20:48:10 22KB hhhhh
1
微博语料情感分析代码,希望大家互相学习,互相帮助。
2019-12-21 20:46:08 2.91MB 语料情感分析
1
本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用空格隔开,可以用来训练分词模型。
2019-12-21 20:45:48 108.12MB NLP 语料 中文分词语料 中文语料
1
深度学习中word2vector测试语料text8
2019-12-21 20:41:38 29.89MB 语聊
1
搜狗1.4G 新闻语料
2019-12-21 20:36:50 116B nlp 新闻语料
1
保险领域的问答系统训练语料,可以用来训练chatbot,希望有帮助
2019-12-21 20:35:50 84.16MB 问答系统
1
处理好的人民日报语料,用于命名实体识别,两个文件分别为字符集和词语级
2019-12-21 20:35:50 4.53MB 自然语言处理 命名实体识别
1
著名的Sighan Bakeoff语料。包含了训练集、测试集及测试集的(黄金)标准切分。
2019-12-21 20:35:03 2.33MB 命名实体识别 数据集
1