该内容共包含四部分代码,包含用python的sklearn包实现对kaggle上面泰坦尼克号的生存预测
2021-04-28 21:21:22 38KB 决策树 随机森林 器学习
1
提出一种基于随机森林和转导推理的特征提取方法, 步骤如下: 1)利用带标签的训练样本建立随机森林模型; 2) 将无标签的测试数据导入随机森林模型中,生成全体数据(训练样本和测试数据)的相似性矩阵; 3)对该相似性矩阵进行 多维尺度变换得到全体数据的低维数据表示,即低维特征,使得原高维数据在低维空间中具有更好的可分性. UCI 数据 库的实验结果表明: 与主成分分析方法相比, 该方法将无标签测试集的数据分布信息转移到相似性矩阵中,更好地刻画 整个样本空间上的数据分布特性,从而提高分类器的性能,是一种行之有效的特征提取方法. 最后还讨论了特征提取维 数对模型准确率的影响,为实际应用提供参考.
2021-04-27 12:09:17 357KB 随机森林 特征提取
1
随机森林用于乳腺癌诊断分析代码
2021-04-25 14:03:07 3KB 随机森林 MATLAB
1
随机森林用于变压器故障诊断代码
2021-04-25 14:00:34 3KB 随机森林 变压器故障诊断
1
智慧森林大数据可视化管理平台建设和运营整体解决方案.
提出一种基于随机森林的差分隐私保护算法DiffPRFs,在每一棵决策树的构建过程中采用指数机制选择分裂点和分裂属性,并根据拉普拉斯机制添加噪声。在整个算法过程中满足差分隐私保护需求,相对于已有算法,该方法无需对数据进行离散化预处理,消除了多维度大数据离散化预处理对于分类系统性能的消耗,便捷地实现分类并保持了较高的分类准确度。实验结果验证了本算法的有效性以及相较于其他分类算法的优势。
1
连续随机森林Python 对连续变量使用多处理的随机森林
2021-04-24 14:19:30 7KB Python
1
主要利用R语言进行随机森林回归,还有其他两种回归, library(lattice) library(grid) library(DMwR) library(rpart) library(ipred) library(randomForest) #回归树,装袋算法,随机森林三大回归 #前二种算法可以计算缺失数据,但随机森林不行,所以还需将数据进行清洗整理 data(algae) algae <- algae[-manyNAs(algae,0.2), ]#占有20%的NA值的行去掉 clean.algae <- knnImputation(algae,k=10)#平均值填充NA值 #回归树模型计算 model.tree=rpart(a1 ~ ., data = clean.algae[, 1:12]) summary(model.tree) pre.tree <- predict(model.tree, clean.algae) plot(pre.tree~clean.algae$a1) nmse1 <- mean((pre.tree- clean.algae[,'a1'])^2)/mean((mean(clean.algae[,'a1'])- clean.algae[,'a1'])^2) nmse1
2021-04-24 13:08:53 1KB R语言 随机森林回归
1
森林资源大数据可视化探索.ppt
2021-04-24 09:02:03 31.46MB 大数据可视化解决方案
森林可视化模型模拟技术 - 大数据可视化之路.ppt
2021-04-24 09:02:01 63.01MB 大数据可视化解决方案