UCR时间序列数据集是专为时间序列分类任务设计的一个广泛使用的数据集合,它由美国加利福尼亚大学河滨分校(University of California, Riverside)的Chen, Keogh和Ratanamahatana等人创建并维护。这个数据集包含了各种不同领域的多种类型的时间序列数据,用于测试和比较时间序列分类算法的性能。时间序列分析是统计学和机器学习领域中的一个重要分支,主要关注如何在有序数据点中识别模式和趋势。 时间序列数据是按照特定时间顺序记录的数值,例如股票价格、温度读数、人体运动传感器数据等。在UCR数据集中,每个时间序列都代表一个特定的类别或事件,而分类任务就是根据这些时间序列来预测它们所属的类别。这种任务在许多实际应用中都很常见,如医学诊断、金融市场分析、工业设备故障预测等。 UCR数据集的显著特点是其多样性和复杂性。数据集包含了超过100个不同的数据集,每个数据集都具有不同的特征,如不同长度的时间序列、不同数量的类别的不平衡等。此外,数据集还经过精心设计,以确保在不同规模和难度上对分类算法进行测试。这使得UCR数据集成为评估新时间序列分类方法效果的理想选择。 深度学习在处理时间序列数据时发挥了重要作用,尤其是通过使用循环神经网络(RNNs)和长短时记忆网络(LSTMs)。这些模型能够捕捉到时间序列中的长期依赖关系,对于识别复杂的时间模式特别有效。在UCR数据集上,可以训练和评估这些深度学习模型,以优化它们在时间序列分类任务上的性能。 为了开始使用UCR数据集,你需要首先解压缩提供的"UCR数据.zip"文件,然后查阅解释文档以了解数据集的结构和各部分含义。通常,每个数据集会包含两个文件:一个用于训练,一个用于测试。数据通常以一维数组的形式表示,其中每个元素对应时间序列中的一个点。在开发和比较算法时,你可能需要将数据预处理成适合深度学习模型的格式,比如将时间序列转换为固定长度的序列或者通过填充和截断来处理不同长度的序列。 在实验过程中,你可以尝试不同的深度学习架构,调整超参数,如学习率、隐藏层大小等,以找到最佳模型。同时,由于UCR数据集中的某些数据集类别分布不均,你还需要注意评估指标的选择,比如使用宏平均(macro-average)或微平均(micro-average)F1分数,以更公平地评估算法在各个类别的表现。 UCR时间序列数据集为研究和开发时间序列分类方法提供了丰富的资源。通过深度学习技术,我们可以构建出强大的模型来处理各种类型的时间序列数据,从而在众多实际应用场景中实现高效、准确的预测。
2024-09-10 10:55:38 121.7MB 时间序列 数据集 深度学习
1
该交通数据集来源于PeMS网站,包含圣贝纳迪诺市(美国加利福尼亚州南部一座城市)8条高速公路1979个探测器,2016年7月1日至2016年8月31日这2个月的数据。这些传感器每5分钟收集一次数据,包含1979个所有的传感器每5分钟经过的车辆数。 数据集 节点 特征数 时长 时间窗口 PeMSD8 107 3 61天 5min 此外本数据集还包含一个3*107的邻接矩阵文件,该数据表示了107个路口之间的相邻情况(即连通性) 以及节点之间的距离。 可用于交通流量预测、交通速度预测、交通拥堵情况预测、交通信号灯绿信比条件、时间序列分析、时空序列分析
2024-09-04 22:13:20 17.45MB 数据集 数据挖掘 交通预测 深度学习
1
该交通数据集来源于PeMS网站,包含旧金山湾区(美国加尼福尼亚州旧金山大湾区)29条高速公路3848个探测器,2018年1月1日至2018年2月28日这2个月的数据。这些传感器每5分钟收集一次数据,包含3848个所有的传感器每5分钟经过的车辆数。 数据集 节点 特征数 时长 时间窗口 PeMSD4 307 3 59天 5min 此外本数据集还包含一个307*307的邻接矩阵文件,该数据表示了307个路口之间的相邻情况(即连通性) 以及节点之间的距离。 可用于交通流量预测、交通速度预测、交通拥堵情况预测、交通信号灯绿信比条件、时间序列分析、时空序列分析
2024-09-04 22:12:25 31.14MB 数据集 数据挖掘 交通预测 深度学习
1
内含常用时间序列预测数据集如:ETT(电力变压器温度)、Traffic(交通数据集)、Electricity(电力消耗数据集)、Exchage_rate(汇率数据集)、Weather(天气数据集)、PEMS、Solar等数据集
2024-07-28 16:39:20 162.28MB 数据集
1
时间序列数据
2024-07-05 21:13:12 426B 源码软件
1
在网络安全领域,恶意软件分析是一项至关重要的任务,它旨在揭示恶意程序的行为模式并发现潜在的威胁。Cuckoo Sandbox是一个广泛使用的开源自动化恶意软件分析系统,它能够在隔离的环境中(称为沙箱)运行可疑文件,观察其行为而不会对实际系统造成影响。本数据集涉及的是恶意程序在Cuckoo沙箱中运行时生成的Windows API调用序列,这为研究人员提供了一种深入理解恶意软件功能和行为的途径。 API(Application Programming Interface)是操作系统提供的接口,允许软件应用程序与操作系统交互。Windows API是Windows操作系统的核心组成部分,提供了大量的函数调用来实现各种操作,如文件管理、网络通信、进程和线程控制等。恶意软件往往依赖特定的API来执行其恶意操作,因此分析API调用序列可以帮助我们识别恶意活动的特征。 数据集中包含的`all_analysis_data.txt`文件很可能包含了每条恶意程序执行过程中记录的API调用及其参数、调用顺序和时间戳等信息。这些信息对于训练机器学习模型是宝贵的,因为不同的恶意软件可能会有独特的API调用模式。通过学习这些模式,模型可以学习区分良性程序和恶意程序,从而实现分类。 机器学习在恶意软件检测中的应用通常分为几个步骤: 1. **数据预处理**:清洗API序列数据,去除不相关的调用,归一化参数,处理缺失值,以及可能的异常值。 2. **特征工程**:提取关键特征,如频繁API组合、API调用频率、调用路径等,这有助于机器学习模型捕获恶意行为的特征。 3. **模型选择**:根据问题的性质选择合适的机器学习算法,如支持向量机(SVM)、决策树、随机森林、神经网络等。 4. **训练与验证**:使用一部分数据训练模型,并通过交叉验证或独立测试集评估模型性能,如精确度、召回率、F1分数等。 5. **模型优化**:通过调整超参数、集成学习方法或使用更复杂的模型结构提升模型的预测能力。 6. **实时检测**:将训练好的模型部署到实际环境中,对新的未知文件进行分类,以识别潜在的恶意行为。 这个数据集为研究和开发更高效的恶意软件检测系统提供了基础,有助于网络安全专家和研究人员构建更加智能的防御策略。通过深入研究和分析这些API序列,我们可以发现新的攻击模式,提高现有的安全防护体系,保护用户和企业的网络安全。
2024-07-03 17:04:01 11.8MB API序列 数据集
数据集齐全(60k+数据) 所用方法多,不论老师要求什么,总有符合用得上(分类,逻辑回归,时间序列) 代码+数据集+报告一条龙服务。 内容说明: 数据预处理,数据清洗,对数据进行描述性分析,统计分析,相关性分析,用ggplot2画图。并分别用逻辑回归和决策树分类建立模型。和用时间序列预测数据。 难度不低于课程实践
2024-07-02 10:43:28 17.94MB r语言 逻辑回归 数据挖掘
PEMS 数据集是由美国加利福尼亚州的交通部门联合其他伙伴机构建立的统一公开交通数据库。美国加利福尼亚州的交通部门在交通路网上大约设置了超过39000 个交通监测站,交通管理部门安装在路网上的各类传感器可以实时地收集所在高速公路上的交通状况信息,越是接近市区人口密集的地区,传感器布置的也越密集,从分布上来看,这些传感器大多被安置在靠近市区的路段上。PEMS提供了超过十年的历史交通状况数据,整合了有关加州运输公司以及其他交通机构系统的各类信息。 PemsD7 交通数据集:数据由分布在加利福尼亚州高速公路系统(CalTrans)中选择 228 个站点数据。数据集从30 秒的数据样本聚合到5 分钟的时间间隔内。时间范围在 2012 年5 月和6 月的工作日的228 个站点交通速度信息,数据包括邻接矩阵和特征矩阵。 邻接矩阵是通过分析已有时空交通数据的特性,构建一种新的具有相似交通流量模式的 矩阵,特征矩阵是每个传感器节点的时间序列特征矩阵。
2024-06-24 10:18:24 40.78MB 深度学习 交通预测 数据挖掘 交通网络
1
PEMS 数据集是由美国加利福尼亚州的交通部门联合其他伙伴机构建立的统一公开交通数据库。美国加利福尼亚州的交通部门在交通路网上大约设置了超过39000 个交通监测站,交通管理部门安装在路网上的各类传感器可以实时地收集所在高速公路上的交通状况信息,越是接近市区人口密集的地区,传感器布置的也越密集,从分布上来看,这些传感器大多被安置在靠近市区的路段上。PEMS提供了超过十年的历史交通状况数据,整合了有关加州运输公司以及其他交通机构系统的各类信息。 PemsD3 交通数据集:数据由分布在加利福尼亚州高速公路系统(CalTrans)中选择 228 个站点数据。数据集从30 秒的数据样本聚合到5 分钟的时间间隔内。时间范围在 2012 年5 月和6 月的工作日的228 个站点交通速度信息,数据包括邻接矩阵和特征矩阵。 邻接矩阵是通过分析已有时空交通数据的特性,构建一种新的具有相似交通流量模式的 矩阵,特征矩阵是每个传感器节点的时间序列特征矩阵。
2024-05-12 15:41:48 14.68MB 深度学习 数据挖掘 交通预测 交通网络
1
基于振动信号的滚动轴承故障诊断 1.介绍 毕设研究课题,根据轴承的振动数据信息来诊断轴承故障的位置和故障严重等级。方法思路走的是数据驱动,使用传统机器学习方法以及深度学习方法。这个开源项目做的是整理基于传统机器学习的轴承故障诊断的内容。 主要分为三个部分: 数据集预处理:数据集增强(utils.augment) 特征工程(utils.feature):均值(mean), 均方差(rms), 标准差(std), 偏度(skewness), 峭度(kurtosis), 包络谱最大幅值处频率(maxf), 信号熵(signal_entropy), 信号幅值中位数处概率密度值(am_median_pdf) 分类器训练和保存 2.在0HP上测试集score: KNN score is: 90.295% in test dataset GaussianNB score is: 91.561% in t
2024-03-26 22:15:38 434KB 附件源码 文章源码
1