传统上,葡萄栽培者对研究葡萄叶/叶柄的生物化学与其相关光谱反射率之间的关系具有浓厚的兴趣,以便了解果实的成熟率,水分状况,营养水平和疾病风险。 在本文中,我们对330至2510 nm的反射波长区域(986个总光谱带)实施成像光谱(高光谱)反射率数据,以评估葡萄园的营养状况。 这构成了带有病态协方差矩阵的高维数据集。 对有助于营养评估和预测的有用信息的变量(波段)的识别在多元统计建模中起着关键作用。 近年来,研究人员已成功开发出许多连续的,几乎无偏的,稀疏且准确的变量选择方法来克服此问题。 本文比较了四种正则化和一种功能回归方法:弹性网,多步自适应弹性网,Minimax凹面惩罚,迭代确定性独立筛选以及用于波长变量选择的功能数据分析。 此后,使用逐步回归可增强这些正则化稀疏模型的预测性能。 使用高维和高度相关的葡萄高光谱数据集进行回归方法的比较研究表明,Elastic Net用于变量选择的性能产生了最佳的预测能力。
1