keras下载速度慢或者下载不下来时,可将数据集放入.keras/datasets下即可(一般在用户目录下)
2019-12-21 20:43:49 17.31MB 文本分类 imdb数据 情感分类
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2019-12-21 20:31:29 70KB 词频计算
1
基础文档,曾被国际上多次引用。通过多反面对比了n-gram技术在文字引索中的应用。
2019-12-21 20:27:21 73KB n-gram
1
使用KNN最近邻算法对文本的情感进行分类和回归预测的数据集
2019-12-21 20:24:14 143KB KNN数据
1
本语料库由复旦大学李荣陆提供。 train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。 下载后可以自己重新切分数据,也可以直接用。 免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ 密码:dq9m 使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-21 20:24:05 106.17MB 中文文本分类 数据集
1
新闻栏目中文文本分类,新闻栏目一共有: 体育 5000 时政 5000 房产 5000 家居 5000 财经 5000 时尚 5000 科技 5000 教育 5000 娱乐 5000 游戏 5000 每个新闻栏目拥有5000条新闻,通过对新闻内容作为样本训练模型,使得该模型能够预测出该条新闻所属的栏目。
2019-12-21 20:19:49 66.03MB 文本分类数据集
1
文本挖掘 文本分类 数据集 进行文本挖掘,文本分类聚类等研究的可用的数据集
2019-12-21 20:19:44 17.4MB 文本挖掘 文本分类 数据集
1
是一个关于小米产品的评论的情感分类代码,词向量构建使用word2vec,使用svm,logistic回归,神经网络,knn,决策树等不同方法进行分类
1
自己写论文手工标注的8分类的数据集,做文本情感分类用
2019-12-21 20:12:22 6.83MB 情感识别 文本分类 多分类 情感分类
1
网易新闻语料库 文本分类 自然语言处理 网上基本找不到哦~~
2019-12-21 20:12:04 37.74MB 网易新闻语料 文本分类 自然语言处理
1