内容摘要: 在该资源文件夹当中包括了数据预处理和特征工程后的数据(数据来源于第五届泰迪杯技能赛,数据经过作者预处理和特征工程),以及一步导出随机森林训练结果的模型评估函数,模型的特征重要性图像、模型评估的混淆矩阵。同时资源中还有数据不平衡得处理操作,实现方式为下采样。在资源当中还实现了,利用遗传算法(GA)对随机森林进行n_estimators、max_depth、min_samples_split、min_samples_leaf、max_features的参数优化。 资源结构: -BinaryClassification(GA) --data:数据 --image:导出图片 --model:模型参数 --Binary_RF(GA).py:遗传算法优化 --BinaryRF.py:常规随机森林分类 适合人群: 该资源适合用来竞赛和写论文,可以快速导出结果,大大节省时间。 使用建议: 二分类数据预处理和特征工程处理好后,导入数据分配好特征和标签,然后运行就可以导出模型的训练权重和模型的特征重要性图像、模型评估的混淆矩阵图像。遗传算法调参属于进阶内容,不懂得可以私信作者。
1
毕业设计开题报告-校园助手学微森林 微信小程序.doc
2022-11-19 13:30:44 44KB 文档资料 微信小程序 小程序
随机森林图像matlab代码指静脉生物特征识别 使用机器学习的手指静脉生物识别 使用机器学习算法分析人的手指静脉数据的MATLAB应用程序。 手指静脉生物识别技术是最先进的身份验证系统之一,它解决了现有身份验证系统的许多问题。 支持向量机(具有线性,RBF,MLP,二次和多项式内核),随机森林,决策树,线性和逻辑回归,K均值,DB扫描,最近邻居,K最近邻居是用于训练的一些算法并测试数据集。 使用过的CCD扫描图像数据。 这些图像经过预处理,过滤并使用所得数据。 2D绘图显示了分类结果和精度。 源代码具有静态文件路径,如果处理不当,可能会出错。
2022-11-18 18:22:05 197KB 系统开源
1
随机森林回归,包含可视化和预测
2022-11-16 18:32:28 272KB 随机森林
1
崂山森林火灾扩散模拟分析与决策系统可以演示时隔离带宽度统计、火险等级实景预报分析、火势蔓延情况、火势蔓延情况、二维火险等级预报分析等,但需要自己配置环境,程序比较大,加上数据库有几百MB
2022-11-16 15:51:35 116B 火灾扩散模拟 ArcEngine AE
1
项目3:多分类 作者:Khyatee Desai和David Shin 概述 Spotify一直在寻求创建其他功能和播放列表,以使用户发现来自不同流派和时代的新歌手。 新增内容可能会导致现有用户续订该应用程序的每月订阅,并希望扩展其音乐种类。 以下分析旨在证明音乐可以根据其音乐属性所源自的时间段进行分类。 通过类型分类发现新歌手不仅使用户受益,而且使歌手和Spotify受益。 未知的艺术家将从更多的发现方法中受益,Spotify可能获得更多的收入和更多的数据。 业务问题 要开发最佳功能和播放列表,我们需要了解在按时间段对音乐进行分类时哪些功能最重要。 创建新功能可能会推动客户续订并吸引新用户的兴趣。 数据 我们使用的主要数据集包含1921-2020年间歌曲属性。 Spotify数据包含每个轨道的音频功能,如下所示: 钥匙 值类型 值说明 duration_ms 整型 轨道的持续时间(以
2022-11-15 21:05:39 31.67MB spotify random-forest xgboost logistic-regression
1
地上碳储量(AGC)的定量对于可持续森林管理和缓解气候变化的政策建议很重要。 传统的地面植被调查方法已被用来提供用于估计AGC储量的数据,但是受时间不足和通常成本过高的限制。 即使没有充分利用这种机会,遥感结合少量地面收集的数据也有可能改善森林资源评估的潜力。 在这项研究中,我们通过结合从51个永久性树苗样地收集的地面调查数据与Landsat 5专题制图仪图像得出的归一化植被指数(NDVI)相结合来绘制AGC。 在监督分类的训练阶段将两个数据源进行了链接。 总体分类精度为98%,这表明可以通过组合中等分辨率的卫星图像和少量地面样本来对大面积AGC进行可靠的估算。
2022-11-14 12:40:25 2.07MB Miombo林地 NDVI
1
少儿scratch编程项目源代码文件案例素材-森林历险记.zip
2022-11-09 14:27:18 458KB scratch 源代码 少儿趣味编程 游戏案例
森林迷宫-少儿编程scratch项目源代码文件案例素材.zip
2022-11-09 14:26:59 6.39MB scratch 源代码 少儿趣味编程 游戏案例
Random forest is a commonly-used machine learning algorithm, which combines the output of multiple decision trees to reach a single result.
2022-11-09 13:21:29 2.05MB 集成学习
1