时间序列数据
2024-07-05 21:13:12 426B 源码软件
1
在网络安全领域,恶意软件分析是一项至关重要的任务,它旨在揭示恶意程序的行为模式并发现潜在的威胁。Cuckoo Sandbox是一个广泛使用的开源自动化恶意软件分析系统,它能够在隔离的环境中(称为沙箱)运行可疑文件,观察其行为而不会对实际系统造成影响。本数据集涉及的是恶意程序在Cuckoo沙箱中运行时生成的Windows API调用序列,这为研究人员提供了一种深入理解恶意软件功能和行为的途径。 API(Application Programming Interface)是操作系统提供的接口,允许软件应用程序与操作系统交互。Windows API是Windows操作系统的核心组成部分,提供了大量的函数调用来实现各种操作,如文件管理、网络通信、进程和线程控制等。恶意软件往往依赖特定的API来执行其恶意操作,因此分析API调用序列可以帮助我们识别恶意活动的特征。 数据集中包含的`all_analysis_data.txt`文件很可能包含了每条恶意程序执行过程中记录的API调用及其参数、调用顺序和时间戳等信息。这些信息对于训练机器学习模型是宝贵的,因为不同的恶意软件可能会有独特的API调用模式。通过学习这些模式,模型可以学习区分良性程序和恶意程序,从而实现分类。 机器学习在恶意软件检测中的应用通常分为几个步骤: 1. **数据预处理**:清洗API序列数据,去除不相关的调用,归一化参数,处理缺失值,以及可能的异常值。 2. **特征工程**:提取关键特征,如频繁API组合、API调用频率、调用路径等,这有助于机器学习模型捕获恶意行为的特征。 3. **模型选择**:根据问题的性质选择合适的机器学习算法,如支持向量机(SVM)、决策树、随机森林、神经网络等。 4. **训练与验证**:使用一部分数据训练模型,并通过交叉验证或独立测试集评估模型性能,如精确度、召回率、F1分数等。 5. **模型优化**:通过调整超参数、集成学习方法或使用更复杂的模型结构提升模型的预测能力。 6. **实时检测**:将训练好的模型部署到实际环境中,对新的未知文件进行分类,以识别潜在的恶意行为。 这个数据集为研究和开发更高效的恶意软件检测系统提供了基础,有助于网络安全专家和研究人员构建更加智能的防御策略。通过深入研究和分析这些API序列,我们可以发现新的攻击模式,提高现有的安全防护体系,保护用户和企业的网络安全。
2024-07-03 17:04:01 11.8MB API序列 数据集
数据集齐全(60k+数据) 所用方法多,不论老师要求什么,总有符合用得上(分类,逻辑回归,时间序列) 代码+数据集+报告一条龙服务。 内容说明: 数据预处理,数据清洗,对数据进行描述性分析,统计分析,相关性分析,用ggplot2画图。并分别用逻辑回归和决策树分类建立模型。和用时间序列预测数据。 难度不低于课程实践
2024-07-02 10:43:28 17.94MB r语言 逻辑回归 数据挖掘
PEMS 数据集是由美国加利福尼亚州的交通部门联合其他伙伴机构建立的统一公开交通数据库。美国加利福尼亚州的交通部门在交通路网上大约设置了超过39000 个交通监测站,交通管理部门安装在路网上的各类传感器可以实时地收集所在高速公路上的交通状况信息,越是接近市区人口密集的地区,传感器布置的也越密集,从分布上来看,这些传感器大多被安置在靠近市区的路段上。PEMS提供了超过十年的历史交通状况数据,整合了有关加州运输公司以及其他交通机构系统的各类信息。 PemsD7 交通数据集:数据由分布在加利福尼亚州高速公路系统(CalTrans)中选择 228 个站点数据。数据集从30 秒的数据样本聚合到5 分钟的时间间隔内。时间范围在 2012 年5 月和6 月的工作日的228 个站点交通速度信息,数据包括邻接矩阵和特征矩阵。 邻接矩阵是通过分析已有时空交通数据的特性,构建一种新的具有相似交通流量模式的 矩阵,特征矩阵是每个传感器节点的时间序列特征矩阵。
2024-06-24 10:18:24 40.78MB 深度学习 交通预测 数据挖掘 交通网络
1
PEMS 数据集是由美国加利福尼亚州的交通部门联合其他伙伴机构建立的统一公开交通数据库。美国加利福尼亚州的交通部门在交通路网上大约设置了超过39000 个交通监测站,交通管理部门安装在路网上的各类传感器可以实时地收集所在高速公路上的交通状况信息,越是接近市区人口密集的地区,传感器布置的也越密集,从分布上来看,这些传感器大多被安置在靠近市区的路段上。PEMS提供了超过十年的历史交通状况数据,整合了有关加州运输公司以及其他交通机构系统的各类信息。 PemsD3 交通数据集:数据由分布在加利福尼亚州高速公路系统(CalTrans)中选择 228 个站点数据。数据集从30 秒的数据样本聚合到5 分钟的时间间隔内。时间范围在 2012 年5 月和6 月的工作日的228 个站点交通速度信息,数据包括邻接矩阵和特征矩阵。 邻接矩阵是通过分析已有时空交通数据的特性,构建一种新的具有相似交通流量模式的 矩阵,特征矩阵是每个传感器节点的时间序列特征矩阵。
2024-05-12 15:41:48 14.68MB 深度学习 数据挖掘 交通预测 交通网络
1
基于振动信号的滚动轴承故障诊断 1.介绍 毕设研究课题,根据轴承的振动数据信息来诊断轴承故障的位置和故障严重等级。方法思路走的是数据驱动,使用传统机器学习方法以及深度学习方法。这个开源项目做的是整理基于传统机器学习的轴承故障诊断的内容。 主要分为三个部分: 数据集预处理:数据集增强(utils.augment) 特征工程(utils.feature):均值(mean), 均方差(rms), 标准差(std), 偏度(skewness), 峭度(kurtosis), 包络谱最大幅值处频率(maxf), 信号熵(signal_entropy), 信号幅值中位数处概率密度值(am_median_pdf) 分类器训练和保存 2.在0HP上测试集score: KNN score is: 90.295% in test dataset GaussianNB score is: 91.561% in t
2024-03-26 22:15:38 434KB 附件源码 文章源码
1
最近 Transformer 在统一建模方面表现出了很大的威力,是否可以将Transformer应用到时序异常检测上引起了很多学者的研究兴趣。 最近来自阿里达摩院、上海交通大学的几位学者就近年来针对时间序列场景中的Transformer模型进行了汇总,在Arxiv上发表了一篇综述。综述涵盖了Transformer针对时序问题下的具体设计,包含预测、异常检测、分类等诸多工业界常用场景,并开源了代码,是非常不错的学习资料。 优秀毕业设计:基于transformer的序列数据二分类完整代码+数据可直接运行
2024-01-15 18:12:59 492KB 毕业设计 transformer
1
代码实现了将时间序列根据所给符号类别数等概率划分成多个区间,根据所给字节长度数实现时间序列到符号化频次直方图序列的转换,并包含一个简单样本的转化实现
2023-11-24 15:56:10 2KB python 时间序列 数据处理
1
2018 UCR Time Series Classification Archive(UCI时间序列数据集,共包含128个数),可用于时间序列分类任务,解压密码为 someone
2023-10-13 16:22:29 301.53MB 数据集
1
用python实现,随便输入一个序列(乱序),判断这个序列是否是图序列,如果是,输出图形(有脚标)。
2023-06-03 15:38:01 2KB python 图论 图序列 数据结构
1