跨数百个基因组进行基因家族注释的管道
该管道可以自动化并标准化新生成的基因组数据集中许多基因家族的基因家族注释。 该管道可以获取最准确的基因拷贝数,并最大程度地减少可能会干扰下游比较分析的方法论偏见。 BITACORA和GeMoMa是用于识别和注释基因组装配中的基因家族的主要工具,第一步是基于输入文件以及要注释的基因家族信息,使用Blastp和InterProScan识别和管理基因模型。
内容
先决条件
安装
计算要求
用法
4.1准备数据
4.2运行管道
4.3输出
例子
1.先决条件
运行管道所必需的依赖关系是:
Perl :大多数操作系统默认安装Perl。 有关安装说明,请参见 。
Python :从下载可用的最新版本
BLAST :从以下地址下载blast可执行文件:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATE
2024-06-05 13:05:28
1.23MB
Perl
1