本文描述了最新的回归技术随机森林分位数回归森林(QRF)的新扩展,以应用于具有数千个特征的高维数据。 我们提出了一种新的子空间采样方法,该方法从两个单独的特征集中随机抽取一个特征子集,一个特征集包含重要特征,另一个特征集包含次要特征。 这两个功能部件集基于功能部件的重要性度量对输入数据进行分区。 通过使用特征置换产生分区原始重要性特征评分首先进行,然后应用p值评估将重要特征与次要特征分开。 新的子空间采样方法能够从袋装样本数据生成树,而回归误差较小。 对于点回归,我们从两个分位数Q0:05和Q0:95之间的范围中选择Y的预测值,而不是回归随机森林中使用的条件均值。我们的实验结果表明,具有这些扩展的随机森林要优于回归随机森林和分位数回归森林减少均方根残差。
2022-04-29 20:10:19 358KB Regression Random Forests; Quantile
1
Algorithm-random-sampling.zip,Java 8中用于水库随机抽样问题的算法集合,算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。
2022-04-23 15:03:28 50KB Algorithm
1
The aim of this book is to provide the reader with a fairly thorough treatment of the main body of basic and classical probability theory, preceded by an introduction to the mathematics which is necessary for a solid treatment of the material.
2022-04-23 11:57:52 2.31MB probability random process
1
Python中的轨迹分析和分类(Pandas和Scikit Learn) 一项针对数据挖掘研究生课程的大学项目。 给我们一个trainset,其中地理点与时间间隔成对。 首先,我们清理数据集,然后形成轨迹(具有相应的路线ID)。 本部分的最后一步是根据_their的total_distance和最大距离(它们的两个点之间)过滤掉一些轨迹。 该项目的目标首先是计算test_set_a1 / a2.csv和train_set.csv的轨迹之间的轨迹相似度。 用于该算法的算法是: 快速动态时间规整(Fast-DTW) ,取自 我实现的最长公共子序列算法。 每次考虑的距离是点的Haver
2022-04-13 21:36:53 24.33MB python machine-learning random-forest dtw
1
sentiment_analysis:亚马逊手机评论的情感分析
1
Probability Distributions Involving Gaussian Random Variables.pdf
2022-04-07 20:46:31 5.11MB distribution
1
这是有关随机网络的一些论文,当时做的时候我仔细作了注释,希望能跟大家一起分享。
2022-03-29 23:05:50 98KB random networks 随机 网络
1
信号处理的经典教材,统计信号处理的基础书。
2022-03-25 10:46:12 8.13MB probability random signal processing
1
主要介绍了python编程实现随机生成多个椭圆实例代码,具有一定借鉴价值,需要的朋友可以参考下
2022-03-21 15:25:34 100KB python random python 随机函数
1
随机数生成器-Android 一个简单的安卓设备随机数生成器。 适合初学者,作为学习 android 应用程序如何工作的一种方式。
2022-03-20 22:57:23 1.14MB Java
1