Usage:
/home/chenlianfu/chenlianfu_scripts/blast.pl [options] BLAST_DB file.fasta > out.txt
--tmp-prefix default: blast
设置临时文件或文件夹前缀。默认设置下,程序生成command.blast.list,blast.tmp/等临时文件或目录。
--chunk default: 10
设置每个数据块的序列条数。程序会将输入FASTA文件中的序列从前往后分割成多份,每10条相邻的序列分配到一个FASTA文件中;在blast.tmp/临时文件夹下生成次级文件夹,每个文件夹做多放置10个FASTA文件;每个fasta文件写出一条BLAST命令到command.blast.list文件中;然后程序调用ParaFly进行并行化计算。
请注意:若数据块的数量超过100万个,默认设置下blast.tmp/文件夹中的目录数量太多(超过1万个),导致文件系统运行缓慢,ParaFly程序运行效率低下,无法充分利用服务器计算资源。此时推荐设置--chunk参数值为100。
--blast-program default: blastp
设置运行的BLAST命令,支持的命令有:blastn, blastp, blastx, tblastn, tblastx。
--CPU default: 1
设置并行运行的BLAST程序个数。
--blast-threads default: 1
设置BLAST命令的-num_threads参数值。该参数让每个BLAST命令可以多线程运行。
请注意:--blast-threads参数值和--CPU参数值的乘积不要超过服务器的CPU总计算线程数。
--evalue default: 1e-3
设置BLAST命令的-evalue参数值。
--outfmt default: 5
设置BLAST命令的-outfmt参数值。输出方式。若为5,则输出xml格式结果,若为6或7,则输出表格结果。
--max-target-seqs default: 20
设置BLAST命令的-max_target_seqs参数值。该参数设置BLAST最多能匹配数据库中的序列数量。
-clean
若添加该参数,则在运行程序成功后,会删除临时文件或文件夹。
1