Unsplash 在 2016 年开放了图片 API,截止目前已经达到了每月百万次调用,以及各种不同的使用场景。Unsplash 数据集于 2020 年八月宣布开放两个照片检索数据集,为更多的学者和科研机构提供研究资料。 Unsplash 数据集包含两个版本: 精简版数据集(下载链接为该版本):可用于商业和非商业使用场景。包含 2.5 万张自然主题的 Unsplash 照片的检索信息,共 2.5 万个关键词。 完整版数据集:仅限于非商业使用场景。包含 200 万张高质量 Unsplash 照片的检索信息,共 500 万个关键词。 本数据集为精简版数据集,压缩包 190M,解压后 550M ,包含四个单独的 TSV 文件(备注:TSV 文件可以在 PostgreSQL 数据库或 Pyhton 环境中加载)分别为: Collections : 82 MB 包含 Unsplash 用户创建的照片收藏夹的信息:包括照片的 ID(photo_id)、收藏夹的 ID(collection_id)、收藏夹的标题 (collection_title) 和时间戳 (photo_collecte
2022-07-13 11:05:24 194.59MB 数据集
Cardiac MRI Dataset 是心房医疗影像数据集,数据均来自于心脏病患者,其包括左心室心内膜和外膜的图像标注,涵盖 33 位患者的 7980 张图像。 该数据集由 IBM Research – Almaden 的 Brain-Inspired Computing 小组于 2008 年发布,主要发布人为 Alexander Andreopoulos 和 John K. Tsotsos,相关论文有《Efficient and Generalizable Statistical Models of Shape and Appearance for Analysis of Cardiac MRI》。
2022-07-13 11:05:10 427.14MB 数据集
FIRE: Fundus Image Registration Dataset 是一个视网膜眼底图像数据集,其拥有 129 张眼底视网膜图像,并根据不同特征组合成 134 对图像,这些图像组合根据特征被划分为 3 类,其中眼底图像由 Nidek AFC-210 眼底照相机采集,分辨率为 2912 * 2912,视觉仰角为 40 度。 该数据集由 Papageorgiou Hospital 和 Aristotle University of Thessaloniki 共同构建并于 2017 年发布,数据来自于 Thessaloniki 大学的 39 名患者,主要发布人有 C. Hernandez-Matas、X. Zabulis、A. Triantafyllou、P. Anyfanti、S. Douma 和 A.A. Argyros,相关论文有《FIRE: Fundus Image Registration Dataset》。
2022-07-13 11:05:05 266.4MB 数据集
Standford Question Answering Dataset (SQuAD) is a reading comprehension dataset by Standford University and has two versions. 斯坦福问答数据集是由斯坦福大学创建的阅读理解数据集,有两个版本。 Know What You Don’t Know- Unanswerable Questions for SQuAD paper.pdf LUKE.pdf SQuAD1.1.pdf SQuAD_dev_datasets.zip SQuAD_train_datasets.zip SQuAD_datasets.txt
2022-07-12 06:07:02 11.31MB 数据集
1
[ACL 2020]对话式讲故事:地牢和龙的数据集的关键作用 总览 本文描述了《地牢与龙》的关键角色数据集(CRD3)及其相关分析。 关键角色(Critical Role)是一个无脚本的现场直播节目,固定人群在其中玩开放式角色扮演游戏《龙与地下城》。 该数据集是从159个关键角色情节中收集的,这些情节被转录为文本对话,包括398,682个回合。 它还包括从Fandom Wiki收集的相应抽象摘要。 该数据集在语言上是独一无二的,因为叙述完全是通过玩家的协作和口头互动来产生的。 对于每个对话,都有大量的转弯,详细程度各不相同的多个抽象摘要以及与先前对话的语义联系。 此外,我们提供了一种数据增强方
2022-07-12 04:34:05 280.59MB nlp machine-learning storytelling dataset
1
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR
2022-07-09 14:49:46 145.88MB data
1
遥感数据集:包含6个数据集 - spacenet - AICrowd - CHN6-CUG - deepglobe-road-dataset - Massachusetts - Massachusetts-building
2022-07-08 11:10:14 56B 数据集 遥感
102 Category Flower Dataset图片标签、训练集标签、验证集标签、测试集标签 代码片段和文件信息 属性 大小 日期 时间 名称 ----------- --------- ---------- ----- ---- 目录 0 2018-05-18 22:02 数据集标签\ 文件 502 2018-05-07 22:23 数据集标签\imagelabels.mat 文件 14989 2018-05-07 22:23 数据集标签\setid.mat
2022-07-02 09:10:52 16KB 深度学习
1
3D Shapes Dataset 3D图形数据集.h5
2022-06-29 09:06:44 255.18MB 数据集
Action Recognition Dataset行为识别数据集.zip
2022-06-29 09:06:43 230B 数据集