基于FFT加速插值的t-SNE(FIt-SNE)
介绍
t随机邻域嵌入( )是一种成功的用于降维和可视化高维数据集的方法。 t-SNE的一种流行是使用Barnes-Hut算法在每次梯度下降迭代时近似梯度。 我们加快了实现过程,如下所示:
N体模拟的计算:我们不是使用Barnes-Hut逼近N体模拟,而是插值到等距网格上并使用FFT进行卷积,从而显着减少了每次梯度下降迭代时计算梯度的时间。 有关其工作原理的一些直观信息,请参见。
输入相似度的计算:我们不是使用优势点树来计算最近的邻居,而是使用库来近似最近的邻居。 邻居查找是多线程的,以利用具有多个内核的计算机。 与严格的``最近''邻居相比,使用``近''邻居更快,但也具有平滑效果,这对于嵌入某些数据集很有用(请参阅 )。 如果需要细微的细节(例如,在识别小型集群中),请使用有利点树(在此实现中也是多线程的)。
查看我们的或以获取更
1