可扩展且灵活的概率PCA用于大规模遗传变异数据
笔记:
现在不维护该存储库。 请检查
我们提出了一种可扩展且精确的算法来计算遗传变异数据的主要成分。 我们的方法基于先前提出的概率PCA,PPCA的潜在变量模型(Roweis,1999; Tipping和Bishop,1999),其中PCA出现在小方差极限内。 潜在变量模型公式化导致了一种迭代EM算法,该算法用于计算具有时间复杂度O(KMN)的主成分,以每次迭代计算N个个体和M个SNP上的K个主成分。
入门
这些说明将为您提供在本地计算机上运行并运行的项目的副本,以进行开发和测试。
先决条件
在Linux机器上,需要以下软件包才能编译和使用软件包。
g++
cmake
make
正在安装
安装FastPPCA非常简单。 只需在linux机器上发出以下命令
git clone https://github.com/aman71197/fa
1