星座图的matlab代码自动编码器用于降维
使用自动编码器进行降维的简单,单个隐藏层示例
在现代“大数据”时代,一项艰巨的任务是减少特征空间,因为在当今的超大数据集中执行任何类型的分析或建模在计算上都非常昂贵。
为此目的,有各种各样的技术:PCA,LDA,拉普拉斯特征图,扩散图等。在这里,我使用了基于神经网络的方法,即自动编码器。
自动编码器本质上是一个神经网络,在中间(以某种方式)对其进行编码之后,它会在其输出中复制输入层。
换句话说,NN在将其输入经过一组堆栈之后尝试预测其输入。
NN的实际体系结构不是标准的,而是用户定义和选择的。
通常看起来像是镜像图像(例如,第一层256个节点,第二层64个节点,第三层又是256个节点)。
在这个简单的介绍性示例中,由于输入空间最初相对较小(92个变量),因此我仅使用一个隐藏层。
对于较大的特征空间,可能需要更多的层/更多的节点。
我将特征空间从这92个变量减少到只有16个。AUC分数非常接近我为此数据集构建的最佳NN(0.753对0.771),因此我们的数据减少了5倍,因此没有牺牲太多信息。
建立自动编码器模型后,我使用它来将我的92个特征的
2021-06-16 20:24:28
1.64MB
系统开源
1