降维算法 一,介绍 在高维层次下会出现数据样本稀疏,距离计算困难等问题,是所有机器学习方法面临的严峻考验,称为“维数灾难”(维数诅咒)。 ,即通过某种数学变换将数据映射到一个低维空间,在这个低维空间里,数据的密度大大地提高,距离计算更加容易。 二,分类 降维算法可以按照是否有监督,变换是否是线性的细分四类: 无监督的线性降维算法,某种 无监督的非线性降维算法,某些 , , , 有监督的线性降维算法,某种 有监督的非线性降维算法(缺) 注意:此处线性指的是高维空间->低维空间是线性的。MDS,Isomap是将一个非线性降维变换的转化问题转化为一个线性代数问题,其本身并不是线性的降维算法。 三,总结 在大部分实际应用情况下,数据降维是作为后续任务的一个预处理步骤,需要通过比较降维后学习器的效果来对一个具体的任务使用某种降​​维算法。 流形学习中的ISOMAP,LLE等算法非常依赖建图的质量
2021-11-13 17:08:00 1.93MB Python
1
线性判别分析分类器和二次判别分析分类器包括代码、纸张、电源点
2021-10-29 21:01:22 1.88MB matlab
1
机器学习与数据科学 机器学习和数据挖掘:回归[线性(选择和收缩,降维,超出线性范围)和非线性回归(逻辑,K-NN,树)],交叉验证(LOOCV,K折,偏差与方差) ,分类(LDA,QDA,K-NN,物流,树,SVM),聚类(PCA,K-Means,分层)本课程将介绍数据挖掘/统计学习的主要主题,包括:统计基础,数据可视化,分类,回归,聚类。 重点将放在统计学习方法,其背后的模型,直觉和假设以及对实际问题的应用上。 您可以在stats 415项目文件夹中找到我的最终项目。 项目总结 实施整个学期学习的所有分类器,以预测通过BMI分类的美国肥胖率,其中最佳分类器为7倍KNN,预测准确性为81.54% 分析模型选择方法以提供最佳模型并找到最佳预测因子; 结论是可以根据收入,饮食习惯,运动习惯和购物习惯来非参数地预测BMI
2021-08-30 13:48:18 18.05MB R
1
Classification matlab code - Quadratic Discriminant Analysis
2020-01-24 03:05:14 1KB QDA Classify matlab
1