这是VLDB 2018的best paper,强烈推荐,在快速训练集方面非常有用!
1
主要介绍了用pandas划分数据集实现训练集和测试集,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2022-03-18 00:09:32 44KB pandas 数据集 pandas训练集 pandas
1
中国交通 标志 C CTSDB数据集训练集2-2,里面 有800个 选项 一半 是txt,文件 中存一半数据图片
2022-03-16 11:20:43 870.34MB 中国交通 标志 C CTSDB数
1
香港城市大学语料库(1 772 202 字,训练集和测试集),文字是繁体的
2022-03-11 15:37:05 4.58MB 语料库 自然语言
1
该文件主要将训练集转换成voc格式,很多深度学习框架都是用VOC数据集格式,例如YOLO。 一般voc解压出来后都包括Annotations, ImageSets, JPEFImages, SegmentationClass , SegmentationObject;详情见链接https://blog.csdn.net/tttabcgy/article/details/80191889
2022-03-06 23:37:29 1KB 训练集 转换 voc格式
1
简单清洗过的金庸全集TXT格式,可做语言模型的训练集
2022-02-26 22:54:03 10.44MB NLP
1
此 Matlab 函数可用于将任何给定的人脸(图像)数据集随机拆分为训练集和测试集。 该函数考虑类/人员标签。 例如,在ORL人脸数据集中,有40个人每个人有10张图像; 该函数可以将每个人的10张图片随机分割成5张训练图片和5张测试图片,如下: load ORL_FaceDataSet % 上传到这里[训练集测试集]=Split_DataSet(ORL_FaceDataSet, 10, 5, 5); 请注意,您可以选择不同数量的训练和测试图像。
2022-02-25 21:29:57 3.54MB matlab
1
由于某些原因,书籍的数据不好下载,特上传csdn供下载。机器学习实战笔记(蜥蜴书2版)所用训练集数据。
2022-02-21 14:30:17 991KB 机器学习 人工智能
1
标签标记器 用于在机器学习中标记训练集标签的小工具 安装 Git在您的系统中克隆此存储库。 安装python3,django 输入三进制的根路径,执行:sh django_server_start.sh 输入 ,尽情享受吧! 如何使用 像这样的首页: 您可以手动标记网页中设置的训练,而不是其他方式。 它可以提高您的效率,并且您可以将此页面共享给其他人。 就像“众包”。 未标记的数据将随机出现,可以保证标记的数据均匀。 这是标记的数据计数,您可以对其进行概述: 用户唯一要做的就是单击单选按钮,然后单击提交按钮,新标记的数据将附加在label_data / label_data.tx
2022-02-17 17:32:15 20KB machine-learning django tool marking
1
数据挖掘、机器学习、AI所用到的测试训练集
2022-02-12 09:02:42 2.44MB 数据挖掘 人工智能 机器学习
1