UCI经典的seeds数据集,可以做数据分析,比如聚类,K-means等等,就不用很麻烦的下载了噢,直接下了用就行了。
2021-09-13 16:05:07 9KB 大数据
1
ICDAR 2015数据集是ICDAR于2015年举办的场景文本检测竞赛中使用的官方数据集,包含了1000张训练图和500张测试图。
2021-09-13 15:38:07 129.11MB text
1
icwb2-data Source : SIGHAN是国际计算语言学会(ACL)中文语言处理小组的简称,其英文全称为“Special Interest Group for Chinese Language Processing of the Association for Computational Linguistics”,又可以理解为“SIG汉“或“SIG汉“。而Bakeoff则是SIGHAN所主办的国际中文语言处理竞赛,第一届于2003年在日本札幌举行(Bakeoff 2003),第二届于2005年在韩国济州岛举行(Bakeoff 2005), 而2006年在悉尼举行的第三届(Bakeoff 2006)则在前两届的基础上加入了中文命名实体识别评测。目前SIGHAN Bakeoff已成功举办了6届,其中Bakeoff 2005的数据和结果在其主页上是完全免费和公开的,但是请注意使用
2021-09-12 22:55:13 50.24MB dataset sighan icwb2-data scoring-script
1
Oxford-IIIT宠物数据集是一个37类宠物数据集,每个数据类大约有100张图像,由牛津大学的Visual Geometry Group创建。图像在比例,姿势和照明方面有很大的差异。所有图像均具有相关的品种,头部ROI和像素级三图分割的地面真相注释。 The Oxford-IIIT Pet Dataset_datasets.txt The Oxford-IIIT Pet Dataset_datasets.zip
2021-09-11 19:53:24 775.33MB 数据集
1
在获得完整的 不完全是! 这个自述文件是实时站点的糟糕替代品。 关于自然地球矢量 Natural Earth 是一个公共领域地图数据集,可用比例为 1:10m、1:50m 和 1:110 百万。 具有紧密集成的矢量(这里)和栅格数据(),通过 Natural Earth,您可以使用制图或 GIS 软件制作各种视觉上令人愉悦的精心制作的地图。 Natural Earth 是通过许多的合作建造的,并得到 (北美制图信息协会)的支持,可免费用于任何类型的项目(有关更多信息参阅我们的页面)。 方便 Natural Earth 解决了一个问题:寻找适合制作小比例地图的数据。 在网络上充斥着地理空间数据的时代,制图师被迫浪费时间筛选混乱的数据,以制作清晰易读的地图。 因为您的时间很宝贵,所以 Natural Earth 数据随时可用。 整洁很重要 精心概括的线条在 1:10m、1:50m 和 1:1
2021-09-11 11:13:13 1.13GB map gis dataset naturalearthdata
1
Dataset from https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data Image Properties: 48 x 48 pixels (2304 bytes) labels: 0=Angry, 1=Disgust, 2=Fear, 3=Happy, 4=Sad, 5=Surprise, 6=Neutral The training set consists of 28,709 examples. The public test set consists of 3,589 examples. The private test set consists of another 3,589 examples. 原链接网速过慢,特上传一份仅供学习
2021-09-10 19:09:36 168.81MB dataset
1
本人的数据集有6类,在网上爬虫分类整理得到的,包含网络爬虫代码。女性蓝色裙子:female_bule_dress:415张;女性蓝色T袖:female_bule_shirt:311张;女性红色裙子:female_red_dress:259张;男性黑色T袖:male_black_shirt:257张;男性蓝色T袖:male_bule_shirt:247张;男性红色T袖:male_bule_shirt:194张
2021-09-10 15:05:20 110.57MB 多标签分类数据集 网络爬虫代码
e-bike电动自行车原始样本图片5500多张,电动车识别数据集,花费大量时间网上收集整理,仅供个人深度学习研究使用,部分可能有版权,商用自行解决版权问题。
TTPLA:用于输电塔和输电线的检测和分段的航拍图像数据集 TTPLA是一个公共数据集,它是输电塔(TT)和输电线(PL)上的航拍图像的集合。 这是论文的官方资料库。 该存储库包括: TTPLA数据集的原始图像带有COCO格式的像素级批注。 (2021年3月更新)。 分割文本文件包含分割为train.txt,validate.txt和test.txt后的图像名称列表。 基于两个不同的主干和三个不同的图像大小的训练模型的权重。 准备数据: 修改resize_image_and_annotation-final.py以使用目标图像尺寸(第10行)。 然后,使用python resize_image_and_annotation-final.py -t 调用脚本。 它将产生一个名为sized_data新文件夹。 然后,如果要删除void标签,请调用remov
2021-09-10 14:58:29 34.38MB Python
1
音乐入耳:具有百万首歌曲数据集的推荐系统 陈晓怡,陈志然,丁开成,刘卫新,王学宁,易瑞涛 卡尼基·梅隆大学 介绍 我们提出并实现了一种机器学习管道,该管道将针对大型个性化歌曲推荐系统的基于内容的推荐方法和协作推荐方法相结合。 目标是在给定用户的收听历史和所有歌曲的完整信息(包括元数据和音频特征分析)的情况下,预测用户将收听的歌曲并向每个用户推荐10首歌曲的推荐列表。 依存关系 Python 3.6 表3.6.1 h5df 0.1.5 脾气暴躁的1.18 Scikit-学习0.23.2 熊猫0.15.2 Matplotlib 3.3.1 希伯恩0.10.1 Spark_notebook_helpers 1.0.1 档案文件 . ├── utils ├── 10605_Project_Report.pdf ├── README.md ├── collaborative_bad_
2021-09-10 13:23:51 1.99MB 系统开源
1