上传者: 38706007
|
上传时间: 2021-10-17 21:55:10
|
文件大小: 12.43MB
|
文件类型: -
变量(波长或特征)选择技术已成为分析具有大量变量和相对较少样本的数据集的关键步骤。 在这项研究中,提出了一种新的变量选择策略,即变量组合种群分析(VCPA)。 该策略由两个关键程序组成。 首先,采用指数递减函数(EDF),这是达尔文自然进化论“适者生存”的一个简单有效的原则,用于确定变量的数量,以保持并不断缩小变量空间。 其次,在每次 EDF 运行中,二元矩阵抽样 (BMS) 策略为每个变量提供相同的选择机会并生成不同的变量组合,用于生成子集总体以构建子模型总体。 然后,采用模型总体分析(MPA)来寻找交叉验证均方根误差(RMSECV)较低的变量子集。 计算每个变量出现在最好的 10% 子模型中的频率。 频率越高,变量越重要。 使用三个真实的 NIR 数据集研究了所提出程序的性能 结果表明,与四种高性能变量选择方法相比,VCPA 是一种很好的变量选择策略:遗传算法 - 偏最小二乘法 (GA