高维数据能充分表达复杂事物的信息,但高维数据自身表达和处理复杂,妨碍了它的实际应用。阐述了用降维算法和构建索引结构来解决高维数据降维问题。以数据对象变异最大方向的投影作为特定数据对象集的主成份,将聚类分析引入高校数据资源的预处理环节,实现了数据对象集合的聚类归约。给出应用实例,为深入探索相关模式提供有效的分析方法。
2022-03-08 22:11:24 302KB 高维数据
1
里面主要描述了常见的数据降维算法,包括公式和yuan'li
2021-12-28 09:35:07 670KB 数据降维
1
详细的CCA 降维方法的matlab实现源代码。
2021-12-28 01:10:02 1KB CCA 降维方法
1
针对传统主成分分析及相关方法对多元时间序列特征表示的局限性,以及降维效果对数据相似性度量质量的影响,从数据形态特征的角度出发,提出一种关键形态特征的多元时间序列降维方法.利用动态时间弯曲方法找出训练集每个类别的中心多元时间序列,根据形态特征找出每个中心多元时间序列的关键特征变量分量的重要度,使用重要度提取若干个关键特征变量分量,达到数据降维的目的.实验结果表明,与传统方法相比,所提方法能够有效地根据形态特征对多元时间序列进行降维,并且能够取得更好的分类效果.
1
局部线性嵌入(LLE)和等距映射(ISOMAP)在降维过程中都只单一地保留数据集的某一种特性结构, 从而使降维后的数据集往往存在顾此失彼的情况。针对这种情况, 借助流形学习的核框架, 提出融合LLE和ISOMAP的非线性降维方法。新的融合方法使降维后的数据集既保持着数据点间的局部邻域关系, 也保持着数据点间的全局距离关系。在仿真数据集和实际数据集上的实验结果证实了该方法的优越性。
2021-11-26 17:14:58 1.71MB 工程技术 论文
1
减少标签空间维数的多标签分类 该程序包括五种线性标签空间转换方法。 所有方法中使用的基础学习器是带有固定正则化参数的正则线性回归。 请在demo.m中查看用法。 与随机丢弃的二进制相关性(BR),主要标签空间变换(PLST)在 遥远的大和林玄天。 具有主标签空间转换的多标签分类。 神经计算,24(9):2508--2542,2012年9月。 条件主标签空间转换(CPLST)在 陈耀南和林玄天。 减少特征识别的标签空间尺寸,以实现多标签分类。 《神经信息处理系统的进展:2012年会议记录(NIPS)》,第1538--1546页,2012年12月。 感知功能的隐式标签空间编码(FaIE)是在 林子嘉,丁桂光,胡明清和王建民。 通过特征感知隐式标签空间编码进行多标签分类。 2014年6月,在第31届国际机器学习国际会议(ICML)的会议记录中。 列子集选择问题(CSSP)在 魏碧和郭富城
2021-11-23 17:59:27 868KB MATLAB
1
Matlab数据降维工具箱 Matlab Toolbox for Dimensionality Reduction Matlab数据降维工具箱,包括几乎所有的数据降维方法:PCA、LDA、ICA、MDS、Isomap、LandmarkIsomap、LLE、LLC、Laplacian、HessianLLE、LTSA、DiffusionMaps、KernelPCA、KernelLDA、SNE、NPE、LPP、SPE、LLTSA、SPCA、CCA、MVU、FastMVU、AutoEncoder、AutoEncoderEA
2021-11-11 16:08:35 1021KB Matlab数据降维
svd算法matlab代码主成分分析(PCA)实验 主成分分析(PCA)非常有用,并且是统计和机器学习中常用的算法之一。 该工具被广泛用于各种应用中,例如用于可视化和分析的降维,压缩,离群值检测和图像处理。 PCA是我最喜欢用于各种任务的工具之一,通常用于可视化目的。 但是,我意识到,一直以来,我一直只是将其用作黑匣子,对它的概念只有很浅的了解。 因此,这激发了我使用PCA的自定义实现创建此存储库的动力。 请注意,此存储库无意描述有关PCA的完整详细信息。 仅显示一些python代码以帮助更好地了解其计算方式。 为了获得更好,更全面的资料,我发现“主成分分析教程” [1]非常有用。 关于PCA 简而言之,该方法对角化输入数据的协方差矩阵。 对角矩阵的属性是所有值都是零,除了对角线上的值必须为非零。 该方法假定输入数据的变量之间存在线性关系,并且删除了它们之间的关系。 有几种计算PCA的方法: 通过协方差矩阵-当特征数比记录数下这是非常有用的。 而且更容易解释这种方法。 通过标产品矩阵-当特征数比记录数较高,这是有用的。 通过奇异值分解(SVD) -这种方法在实践中使用最多(Scikit
2021-11-07 22:31:44 103KB 系统开源
1
因近红外光谱具有波长点多、谱带归属困难、光谱重叠严重及光谱分布结构未知等问题,在进行近红外光谱关键特征提取和数据特征空间映射时难以准确获知合适降维方法。为了解决该问题,本文对比分析了典型线性和非线性降维方法,并用烟叶近红外光谱数据从数据降维可视化和分类准确性识别率角度分别进行了实验验证。结果表明,线性降维算法,特别是PCA、LDA算法,比较适合应用于烟叶近红外光谱降维分析中,非线性降维算法因其泛化学习能力与推广能力差以及本征维数估计困难不适合应用于近红外光谱降维分析。
2021-09-22 12:26:49 335KB 降维
1
34种数据降维方法matlab代码.zip
2021-08-20 19:07:31 1.14MB matlab