稀疏降维matlab代码重新讨论稀疏PCA
稀疏主成分分析(PCA)是一种流行的无监督方法,用于尺寸缩减和特征选择。
与标准PCA相比,稀疏PCA的主要优点是通过在加载矢量的元素(即权重)上施加零强制约束而获得了更高的解释性。
稀疏的加载向量可以更好地理解PCA的特征选择过程。
例子
考虑大小为p
x
n的零均值数据矩阵X
,其中n是样本数。
让我们将PCA获得的第一个主要加载向量表示为w
。
该加载向量包含p个权重,这些权重一起产生第一主成分w'X
,其中包含对应于每个样本的一维变量。
在PCA中,
w是非稀疏的,因此无法轻易获得信息来确定最重要的特征。
一些研究使用稀疏PCA在w中强制执行零权重。
使用稀疏PCA,可以在降维过程中解释功能的重要性/相关性。
但是,假设我们要将维p减小为任意整数q
,例如1
<q
<=
p
。
在这种情况下,常规的稀疏PCA方法不能保证对于i
=
1,...,q
,所有q个加载向量w_i都会选择相同的特征;
换句话说,它们不会具有相同的稀疏模式。
下表显示了模拟数据的示例。
我们提出的方法在保留稀疏模式的同时计算主要载荷。
引文
请引用以下论文
Se
2021-10-14 13:13:07
152KB
系统开源
1