了解UMAP
降维是机器学习从业人员可视化和理解大型,高维数据集的强大工具。 是最广泛使用的可视化技术之一,但其性能在大型数据集中会受到影响,正确使用它可能会。
是McInnes等人的一项新技术。 与t-SNE相比,它具有许多优势,最显着的是提高了速度并更好地保存了数据的全局结构。 在本文中,我们将研究UMAP背后的理论,以便更好地了解该算法的工作原理,如何有效地使用它以及与t-SNE相比其性能如何。
yarn
yarn dev
发布到github页面
yarn pub
单独制定数字
yarn dev:cech
yarn dev:hyperparameters
yarn dev:mammoth-umap
yarn dev:mammoth-tsne
yarn dev:supplement
yarn dev:toy
yarn dev:toy_comparison
数据预处理
对于庞大的数
1