该数据集是由 Boston 警察局提供,包括 2015 年 6 月 14 日至 2018 年 9 月 3 日的犯罪记录。具体内容包括事件编号,描述,时间日期,地点等信息。可被用作于研究犯罪频率、犯罪种类等问题
2022-07-13 16:05:46 10.42MB 数据集
DBPedia Ontology 由 14 个不重叠分类的 40000 个训练样本和 5000 个测试样本组成,其使用来自维基百科派生的大型多域本体。 该数据集的英文版目前描述了 458 万个「事物」以及 5.83 亿个「事实」,其由康奈尔大学于 2015 年发布。
2022-07-13 16:05:45 65.19MB 数据集
该数据集由科罗拉多州丹佛市提供,包括了过去四年及今年丹佛市警方对于行人与车辆的停靠记录。该数据集包括时间、地点、问题、描述等信息,可被用作于犯罪类研究
2022-07-13 16:05:44 71.87MB 数据集
EEG Brain Wave for Confusion Dataset 是学生观看视频时额叶波动的数据集,旨在判断大脑是否处于混乱状态。 发布者收集了 10 名大学生观看 MOOC 视频剪辑时的 EEG 信号数据,其中包含不会让学生感到困惑的在线教育视频、可能会混淆的视频两种。测试过程中,学生会佩戴无线 MindSet 以测量额叶活动,同时观看剪辑后的视频,学生在课程结束后会将混淆等级评定为 1-7,其中 1 对应最不容易混淆,而 7 对应最为混乱。 这些标签会被进一步标准化为学生是否感到困惑的标签,除了预先确定的标签外还包含自我标记的混淆标记。 该数据由 Kaggle 于 2013 年发布,相关论文有《Using EEG to Improve Massive Open Online Courses Feedback Interaction》。
2022-07-13 16:05:43 108.96MB 数据集
该数据集来源于测试台上永磁同步电机的数据,由 Paderborn 大学的 LEA 部门所收集。此数据集中的记录均以 2hz 进行采样,由多个测量部份组成,以 “profile_id” 作为区分。
2022-07-13 16:05:42 46.51MB 数据集
该数据集包含 google 对于航班和机票关键词的排行,共 100 个目的地且每 15 天更新一次。数据集具体内容包括搜索词,排名,标题,链接,搜索结果总数等信息。
2022-07-13 16:05:41 25.02MB 数据集
HetRec 2011 – Last.FM 2k Dataset 包含来自 Last.fm 的一组 2K 用户社交网络、标记和音乐艺术家收听信息,其由 Universidad Autónomade Madrid 的信息检索小组制作。 该数据集由 The Information Retrieval Group 于 2011 年发布。
2022-07-13 16:05:40 2.47MB 数据集
1 Billion Word Language Model Benchmark R13 Output 是一套新的基准语料库,被用于衡量和统计语言建模进展,凭借近 10 亿字的培训数据,该基准测试可以快速评估新的语言建模技术,并将其与其他新技术相结合。 该数据集由康奈尔大学于 2013 年发布,主要发布人有 Ciprian Chelba、Tomas Mikolov、Mike Schuster、Qi Ge、Thorsten Brants、Phillipp Koehn 和 Tony Robinson。
2022-07-13 16:05:40 1.69GB 数据集
该数据集是由布尔诺理工大学发布,包含 6 个由监控摄像头拍摄的视频文件以及相关的速度测量信息,可被用于速度测量,车辆尺寸测量,车辆分类等交通类任务
2022-07-13 16:05:39 1.67GB 数据集
该数据集由 World Bank 提供,包括世界性的区域信息、国家信息、贷款编码、借贷方、贷款状态及具体金额类信息。此数据集可被用于金融类问题研究
2022-07-13 16:05:38 8.71MB 数据集