EN.553.738高维近似,概率和统计学习最终项目
关查理,胡志明,张杰@约翰·霍普金斯大学
在这个项目中,我们探索三种不同的非线性降维/流形学习算法:Isomap,局部线性嵌入(LLE)和扩散图/ Laplacian特征图。 我们在数据集上对这些算法进行基准测试,例如经典的瑞士卷,虹膜,MNIST和神经元尖峰数据。 我们还将它们与主成分分析(PCA)进行比较,后者是一种线性降维算法。 最后,我们有一个使用扩散图的演示来分析氢二聚体的玩具分子动力学模拟的自由能态。
要运行任何基准测试/演示,请启动相应的脚本: python filename.py 。 您可以编辑每个脚本中每个算法中的超参数,例如投影维和相邻算法的数量。
先决条件
脚本要求:
数据集
Swiss Roll和Iris数据集是从sklearn.datasets包生成的。
我们下载了亚·莱卡的网页的数据库MNIST。
神经
2021-04-02 16:39:36
13.34MB
Python
1