UCI经典分类二分类数据集,机器学习算法测试。亲测可用。
2019-12-21 20:38:12 1.47MB 数据集 分类 机器学习
1
本语料库由复旦大学李荣陆提供。 train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。 下载后可以自己重新切分数据,也可以直接用。 免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ 密码:dq9m 使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-21 20:24:05 106.17MB 中文文本分类 数据集
1
新闻栏目中文文本分类,新闻栏目一共有: 体育 5000 时政 5000 房产 5000 家居 5000 财经 5000 时尚 5000 科技 5000 教育 5000 娱乐 5000 游戏 5000 每个新闻栏目拥有5000条新闻,通过对新闻内容作为样本训练模型,使得该模型能够预测出该条新闻所属的栏目。
2019-12-21 20:19:49 66.03MB 文本分类数据集
1
文本挖掘 文本分类 数据集 进行文本挖掘,文本分类聚类等研究的可用的数据集
2019-12-21 20:19:44 17.4MB 文本挖掘 文本分类 数据集
1
最全的商品分类数据,几乎覆盖所有行业 文件说明: tb_bas_prod_category.sql 9千多条三级商品分类 tb_bas_prod_category_brands.sql 54万多条商品分类对应的品牌数据 tb_bas_prod_category_units.sql 4万多条商品分类对应的计量单位数据
2019-12-21 20:17:53 4.86MB 商品分类 三级分类 电商商品 类目大全
1
1688分类ID,类目列表,详情准确,类目大全 包括一级分类,二级分类,三级分类等,示例数据: array ( 'name' => '电工电气', 'pid' => 0, 'pids' => array ( ), 'sub' => array ( 55884010 => '塑壳式断路器', 1039696 => '低频变压器', 1039702 => 'E型变压器', onebound.cn 提供
2019-12-21 20:15:11 44KB 1688分类数据 1688类目
1
康奈尔大学网站的2M影评数据集。 配合教程http://blog.csdn.net/lsldd/article/details/41542107
2019-12-21 20:13:30 2.65MB 电影分类数据
1
自己写论文手工标注的8分类的数据集,做文本情感分类用
2019-12-21 20:12:22 6.83MB 情感识别 文本分类 多分类 情感分类
1
常用数据集IMDB影评倾向分类数据集。本数据库含有来自IMDB的25,000条影评,被标记为正面/负面两种评价。影评已被预处理为词下标构成的序列。
2019-12-21 19:33:30 16.66MB imdb.npz
1
阿里巴巴行业分类数据. 通过在线收集的阿里巴巴的行业数据,真实准确,提供
2019-12-21 19:28:20 200KB 阿里巴巴行业分类数据
1