传统上,葡萄栽培者对研究葡萄叶/叶柄的生物化学与其相关光谱反射率之间的关系具有浓厚的兴趣,以便了解果实的成熟率,水分状况,营养水平和疾病风险。 在本文中,我们对330至2510 nm的反射波长区域(986个总光谱带)实施成像光谱(高光谱)反射率数据,以评估葡萄园的营养状况。 这构成了带有病态协方差矩阵的高维数据集。 对有助于营养评估和预测的有用信息的变量(波段)的识别在多元统计建模中起着关键作用。 近年来,研究人员已成功开发出许多连续的,几乎无偏的,稀疏且准确的变量选择方法来克服此问题。 本文比较了四种正则化和一种功能回归方法:弹性网,多步自适应弹性网,Minimax凹面惩罚,迭代确定性独立筛选以及用于波长变量选择的功能数据分析。 此后,使用逐步回归可增强这些正则化稀疏模型的预测性能。 使用高维和高度相关的葡萄高光谱数据集进行回归方法的比较研究表明,Elastic Net用于变量选择的性能产生了最佳的预测能力。
1
在计算机上验证和测试sklearn的相关降维和主成分分析算法。 1、掌握降维分析算法的原理 2、掌握sklearn如何实现降维分析;
2021-11-28 21:07:29 106KB 机器学习
1
自己总结了在学习局部保持投影过程中的一些概念和心得
2021-11-28 17:40:16 334KB 局部保持投影 降维
1
可以应用于数据的多元分析,降维以及冗余分析,文件内包含多个程序代码,数据文件请根据自身自行导入,这里不提供相应数据文件,该代码偏向初学者,若有不足,欢迎各位指正
2021-11-27 13:46:10 283KB 冗余分析 降维处理 多元分析 matlab
1
局部线性嵌入(LLE)和等距映射(ISOMAP)在降维过程中都只单一地保留数据集的某一种特性结构, 从而使降维后的数据集往往存在顾此失彼的情况。针对这种情况, 借助流形学习的核框架, 提出融合LLE和ISOMAP的非线性降维方法。新的融合方法使降维后的数据集既保持着数据点间的局部邻域关系, 也保持着数据点间的全局距离关系。在仿真数据集和实际数据集上的实验结果证实了该方法的优越性。
2021-11-26 17:14:58 1.71MB 工程技术 论文
1
使用sklearn库自带的手写数字数据来进行PCA降维后再用K-近邻算法去训练,拥有展示成果功能。
2021-11-24 22:07:56 3KB Python scikit-learn PCA
1
减少标签空间维数的多标签分类 该程序包括五种线性标签空间转换方法。 所有方法中使用的基础学习器是带有固定正则化参数的正则线性回归。 请在demo.m中查看用法。 与随机丢弃的二进制相关性(BR),主要标签空间变换(PLST)在 遥远的大和林玄天。 具有主标签空间转换的多标签分类。 神经计算,24(9):2508--2542,2012年9月。 条件主标签空间转换(CPLST)在 陈耀南和林玄天。 减少特征识别的标签空间尺寸,以实现多标签分类。 《神经信息处理系统的进展:2012年会议记录(NIPS)》,第1538--1546页,2012年12月。 感知功能的隐式标签空间编码(FaIE)是在 林子嘉,丁桂光,胡明清和王建民。 通过特征感知隐式标签空间编码进行多标签分类。 2014年6月,在第31届国际机器学习国际会议(ICML)的会议记录中。 列子集选择问题(CSSP)在 魏碧和郭富城
2021-11-23 17:59:27 868KB MATLAB
1
针对卫星多径信号引入的干扰问题,建立了卫星多径干扰信号盲源分离模型,采用基于降维Householder变换的特征矩阵联合近似对角化(JADE)算法对接收的混合信号四阶累积量进行联合近似对角化,从而提取多径信号。实验结果表明,本算法能很好地分离频谱完全重叠的多径信号和部分重叠的干扰信号;在提取多径信号方面,本算法的性能优于快速独立成分分析(FastICA)算法;在运行时间上,FastICA算法运行1000次的平均时间约为采用Givens旋转的Cardoso高阶累积量特征矩阵联合近似对角化(CG-JADE)算法的6倍,而本算法比CG-JADE算法的平均运行时间少0.0024 s,证明了本算法的有效性和快速性。
2021-11-22 20:46:25 9.82MB 卫星多径 盲源分离 特征矩阵 降维House
1
降维算法 一,介绍 在高维层次下会出现数据样本稀疏,距离计算困难等问题,是所有机器学习方法面临的严峻考验,称为“维数灾难”(维数诅咒)。 ,即通过某种数学变换将数据映射到一个低维空间,在这个低维空间里,数据的密度大大地提高,距离计算更加容易。 二,分类 降维算法可以按照是否有监督,变换是否是线性的细分四类: 无监督的线性降维算法,某种 无监督的非线性降维算法,某些 , , , 有监督的线性降维算法,某种 有监督的非线性降维算法(缺) 注意:此处线性指的是高维空间->低维空间是线性的。MDS,Isomap是将一个非线性降维变换的转化问题转化为一个线性代数问题,其本身并不是线性的降维算法。 三,总结 在大部分实际应用情况下,数据降维是作为后续任务的一个预处理步骤,需要通过比较降维后学习器的效果来对一个具体的任务使用某种降​​维算法。 流形学习中的ISOMAP,LLE等算法非常依赖建图的质量
2021-11-13 17:08:00 1.93MB Python
1
PCA、LDA、MDS、LLE、TSNE等降维算法的python实现
2021-11-13 17:01:14 1.44MB pca lda mds lle
1