基因组VCF到制表符分隔的值
用于将VCF数据转换为制表符分隔值(TSV)的Python脚本
一个小的脚本,它将以VCF格式编码的基因组变异数据转换为制表符分隔的值文件。 该脚本利用解析VCF文件。 默认情况下,程序会打印固定的VCF列,所有INFO标签值(在VCF标头中定义,给定记录中不存在的INFO标签都附加“。”),以及杂合子的所有基因型数据(FORMAT列)和纯合子。 如果存在基因型数据,则每个样本打印一行,而表示为VCF_SAMPLE_ID的列表示给定样本的数据。 脚本具有以下可选参数
跳过样本基因型数据(即FORMAT列)
保留拒绝的基因型(即FILTER\uff01='PASS'/ GT =='./。')
跳过INFO数据。
压缩输出TSV
将VCF列的数据类型打印为标题行
重要信息:如果使用大型多样本VCF文件运行vcf2tsv,则输出TSV的大小将Swift增大,因为默认情
1