上传者: 38712578
|
上传时间: 2022-11-02 15:55:19
|
文件大小: 732KB
|
文件类型: PDF
BLAST(基本局部比对搜索工具)是一种局部比对算法,具有很高的准确度,被广泛使用。 它可以在保持高精度的同时减少程序的运行时间,但是在比较大型基因数据集时却存在性能瓶颈和低效率。 因此,提出了一种基于Spark的分布式并行方法Spark_BLAST。 该方法利用Spark内存计算来识别和划分任务,并实现了BLAST算法的分布式并行计算。 最后,该方法在5个节点的Spark集群上实现。 与单机比较表明,Spark .cluster的加速可以达到约4,而不会改变比较结果的准确性。 该方法为生物信息学提供了一种有效的比对方法。