包含ppt课件、原始数据集、C++代码和处理结果onehot、TF、TFIDF矩阵等文件,自学大礼包
2021-08-10 15:04:54 275KB 人工智能/神经网络/深度学习 C/C++
IJB-B是人脸识别一个重要的评测数据集,关于该数据集的描述可参考这篇论文
2021-08-10 14:26:15 1.81MB IJB-B
1
数据集:星巴克门店在全球的分布 在中国的分布 Starbucks.csv china.csv
Apple2Orange数据集包含1261个Apple的照片和1267个Oranges的照片。这两个域都分为训练和测试子集。该数据集来自UC Berkeley的CycleGAN数据集官方目录。 metadata.csv Apple2orange Dataset_datasets.txt Apple2orange Dataset_datasets.zip
2021-08-06 21:17:44 74.59MB 数据集
1
中文缩写语料库 这是论文《A Chinese Dataset with Negative Full Forms for General Abbreviation Prediction》 发布的数据集。 缩写是跨语言的普遍现象,尤其是在汉语中。 在大多数情况下,如果一个表达式可以缩写,那么它的缩写比其完全扩展的形式使用得更频繁,因为人们倾向于以最简洁的方式传达信息。 对于各种语言处理任务,缩写是提高性能的障碍,因为缩写的文本形式不能表达有用的信息,除非将其扩展为完整形式。 缩写预测意味着将完全展开的形式与其缩写相关联。 然而,由于缩写语料库的不足,这样的任务在当前的研究中受到限制,特别是考虑到一般的缩写预测还应该包括那些没有有效缩写的完整形式表达,即否定完整形式(NFFs)。 包含用于一般缩写预测的否定完整形式的语料库数量很少。 为了促进该领域的研究,我们构建了一个通用中文缩写预测数据集,
2021-08-05 16:04:26 157KB
1
UA-GEC:乌克兰语的语法错误纠正和流畅语料库 此存储库包含 UA-GEC 数据和随附的 Python 库。 数据 所有语料库数据和元数据都保存在./data 。 它有两个子文件夹用于 每个拆分(训练和测试)都有用于不同数据表示的更多子文件夹: ./data/{train,test}/annotated以带存储文档 ./data/{train,test}/source和./data/{train,test}/target存储文档的原始版本和更正版本。 这些目录中的文本文件是没有注释标记的纯文本。 这些文件是根据带注释的数据生成的,在某种程度上是多余的。 我们保留它们是因为这种格式在某些用例中很方便。 元数据 ./data/metadata.csv存储每个文档的元数据。 这是一个包含以下字段的 CSV 文件: id (str):文档标识符。 author_id (str):文档作者标
1
This dataset contains tree observations from four areas of the Roosevelt National Forest in Colorado. 该数据集包含科罗拉多州罗斯福国家森林四个地区的树木观测结果。 covtype.csv
2021-08-03 18:27:19 10.7MB 数据集
1
图片按分类文件夹存放,完整数据集: https://github.com/cyizhuo/FGVC-Aircraft-dataset
2021-08-03 17:27:02 879.93MB dataset
1
fire-dataset.zip
2021-08-03 09:49:47 4.06MB 检测数据集
1
所有当前标准普尔500指数公司的历史股票数据,Historical stock data for all current S&P 500 companies,所有文件都有以下的列: Date——格式:yy-mm-dd Open——开盘时的股票价格(这是纽约证券交易所的数据,所以都是美元) High——当天达到的最高价格 Low Close——当天达到的最低价格 Volume——股票交易数量 Name——股票代码名称 该数据集可用于股票分析与预测。
2021-08-03 09:22:32 19.34MB dataset kaggle python
1