介绍 Seqtk是一种快速轻巧的工具,用于处理FASTA或FASTQ格式的序列。 它可以无缝解析FASTA和FASTQ文件,也可以选择使用gzip对其进行压缩。 要安装seqtk , git clone https://github.com/lh3/seqtk.git ; cd seqtk ; make 唯一的库依赖项是zlib。 Seqtk示例 将FASTQ转换为FASTA: seqtk seq -a in.fq.gz > out.fa 将ILLUMINA 1.3+ FASTQ转换为FASTA并将质量低于20的碱基蒙版转换为小写字母(第一个命令行)或N (第二个): seqtk seq -aQ64 -q20 in.fq > out.fa seqtk seq -aQ64 -q20 -n N in.fq > out.fa 折叠长的FASTA / Q线并删除FASTA / Q注
2022-03-02 19:55:50 25KB bioinformatics sequence-analysis C
1
生信经典教材推荐。 本书在结构上大致可以分为四个部分,每个部分所覆盖的问题分别是:二序列联配、多序列联配、系统发育树和RNA结构。具体分为:二序列联配、Markov链与隐马模型、使用HMM的二序列联配、用于序列家族的列型HMM、多序列联配方法、构造系统发育树和系统发育的概率论方法。本书介绍的列型чMM、多序列联配方法、构造系统发育树和系统发育的概率论方法。本书介绍的一些方法将不同的生物信息来源整合到一般的、清晰且可操作的序列分析概率论模型中,有助于研究者深入了解生物序列分析的基础。 本书可供生物信息学、分子生物学、数学、计算机科学以及物理学专业的研究生或高年级本科生及这些领域的老师和研究人员参考。
2020-01-16 03:05:23 7.64MB 生物信息学 序列分析
1