Unsplash 在 2016 年开放了图片 API,截止目前已经达到了每月百万次调用,以及各种不同的使用场景。Unsplash 数据集于 2020 年八月宣布开放两个照片检索数据集,为更多的学者和科研机构提供研究资料。
Unsplash 数据集包含两个版本:
精简版数据集(下载链接为该版本):可用于商业和非商业使用场景。包含 2.5 万张自然主题的 Unsplash 照片的检索信息,共 2.5 万个关键词。
完整版数据集:仅限于非商业使用场景。包含 200 万张高质量 Unsplash 照片的检索信息,共 500 万个关键词。
本数据集为精简版数据集,压缩包 190M,解压后 550M ,包含四个单独的 TSV 文件(备注:TSV 文件可以在 PostgreSQL 数据库或 Pyhton 环境中加载)分别为:
Collections : 82 MB
包含 Unsplash 用户创建的照片收藏夹的信息:包括照片的 ID(photo_id)、收藏夹的 ID(collection_id)、收藏夹的标题 (collection_title) 和时间戳 (photo_collecte
2022-07-13 11:05:24
194.59MB
数据集