通过去除不相关和多余的特征,特征选择旨在找到具有良好泛化能力的原始特征的紧凑表示。 随着无标签数据的普及,无监督特征选择已显示出可有效减轻维数的诅咒,对于全面分析和理解无标签高维数据的无数至关重要,这是由于子空间聚类中低秩表示法的成功所致,我们提出了一种用于无监督特征选择的正则化自我表示(RSR)模型,其中每个特征都可以表示为其相关特征的线性组合。 通过使用L-2,L-1-范数来表征表示系数矩阵和表示残差矩阵,RSR有效地选择了代表性特征并确保了对异常值的鲁棒性。 如果某个特征很重要,则它将参与大多数其他特征的表示,从而导致出现大量的表示系数,反之亦然。 对合成数据和现实世界数据进行的实验分析表明,该方法可以有效地识别代表性特征,在聚类精度,冗余减少和分类精度方面优于许多最新的无监督特征选择方法。
1