基于时间特征的随机森林分类系统(语音 信号都可以) :最大值、最小值、峰峰值、均值、方差、均方值、均方根值等。有量纲特征值的数值大小常因外界一些物理量的变化而变化,给工程应用带来一定困难,因而时常使用多种无量纲指标,包括峰值因子、脉冲因子、裕度因子、峭度因子、波形因子和偏度等。 加上随机森林的分类技术研究
2022-05-30 19:08:34 1.15MB 随机森林 分类 文档资料 算法
使用SVM、随机森林及K-NN进行高光谱图像分类,内置Indian_pines、PaviaU、Salinas数据集及其标签
2022-05-28 19:07:04 65.53MB 支持向量机 随机森林 分类 文档资料
1
飞行延迟预测 介绍 延误是任何运输系统中最令人难忘的性能指标之一。 值得注意的是,民航业者将延误理解为航班延误或推迟的时间。 因此,延迟可以由飞机的起飞或到达的预定时间与实际时间之间的差异来表示。 国家监管机构有许多与航班延误的容忍阈值有关的指标。 实际上,航班延误是航空运输系统中必不可少的主题。 2013年,欧洲有36%的航班延误了超过5分钟,而美国有31.1%的航班延误了超过15分钟。 这表明该指标的相关性如何,以及无论航空公司网格的规模如何对其产生影响。 为了更好地了解整个飞行生态系统,每时每刻都会收集来自商业航空的大量数据并将其存储在数据库中。 淹没在传感器和物联网产生的大量数据中,分析人员和数据科学家正在增强其计算和数据管理技能,以从每个数据中提取有用的信息。 在这种情况下,理解领域,管理数据和应用模型的过程被称为数据科学,这是解决与大数据有关的挑战性问题的趋势。 在此项目中,我
1
钞票认证 这是一个Web应用程序,用于预测空白通知是真实的还是伪造的。 使用的数据集 来自UCI机器学习存储库的钞票身份验证数据集 使用的技术 Python 烧瓶 随机森林分类器 泡菜 屏幕截图
2022-05-11 19:53:03 396KB JupyterNotebook
1
1. 原始数据集的获取。 使用SCIKIT-LEARN的自带的鸢尾花数据集,获取原始鸢尾花数据集。 2.模型的评价方式之一--基于oob_score的模型性能评价 以整个鸢尾花数据集为训练集,分别考察: (1) 决策树数目=10,100,500三种情况下,随机森林的分类性能,性能评价采用: RandomForestClassifier模型的属性“oob_score” (2) 决策树数目=10,100,500三种情况下,bagging模型的分类性能,性能评价采用: BaggingClassifier模型的属性“oob_score” 3. 模型评价方式之二--基于交叉验证的集成模型性能评价 将原始数据集按照类别分层随机打乱,分成K=5等分. (1) 采用K-折交叉验证平均预测错误率(及标准差)为评价指标,分别考察决策树数目=10,100,500三种情况下,随机森林模型的分类性能。 (2) 采用K-折交叉验证平均预测错误率(及标准差)为评价指标,分别考察决策树数目=10,100,500三种情况下,bagging模型的分类性能。
2022-04-27 16:05:34 6KB 随机森林 分类 sklearn 算法
1
原理: 决策树生成算法: 是递归地生成决策树,它往往分类精细,对训练数据集分类准确,但是对未知数据集却没有那么准确,有比较严重的过拟合问题。因此,为了简化模型的复杂度,使模型的泛化能力更强,需要对已生成的决策树进行剪枝。 集成分类算法: 集成(Ensemble)分类模型综合考量多个分类器的预测结果,从而做出决策。 随机森林分类器用相同的训练数据同时搭建多个独立的分裂模型,然后通过投票的方式,以少数服从多数的原则作出最终分类的决策。在相同的训练数据上同时搭建多棵决策树,每棵决策树会放弃固定的排序算法,随机选取特征。 梯度提升决策树按照一定的次序搭建多个分类模型。模型之间彼此存在依赖关系。后续加入
2022-04-02 21:02:07 276KB python python3 决策
1
可以实现简单的随机森林分类算法,含完整数据集及m文件
2022-02-16 09:11:35 44KB matlab 随机森林 分类 开发语言
1
随机森林的matlab代码,既包括随机森林分类代码,也包括随机森林回归代码
2021-11-17 18:42:38 443KB matlab 随机森林 分类 回归
1
【项目实战】基于Python实现随机森林分类模型(RandomForestClassifier)项目 资料说明:包括数据集+源代码+Pdf文档说明。 资料内容包括: 1)项目背景; 2)获取数据; 3)数据预处理: (1)导入程序库并读取数据 (2)数据校验和处理 4)探索性数据分析: (1)数据分析 (2)相关性分析 5)特征工程: (1)哑特征处理 (2)建立特征数据和标签数据 (3)数据集拆分 6)构建随机森林分类模型 7)模型评估 8)实际应用
输入特征向量训练随机森林分类模型,并计算分类结果的Kappa系数,混淆矩阵,准确性,特异性和敏感性。