基因组VCF到制表符分隔的值 用于将VCF数据转换为制表符分隔值(TSV)的Python脚本 一个小的脚本,它将以VCF格式编码的基因组变异数据转换为制表符分隔的值文件。 该脚本利用解析VCF文件。 默认情况下,程序会打印固定的VCF列,所有INFO标签值(在VCF标头中定义,给定记录中不存在的INFO标签都附加“。”),以及杂合子的所有基因型数据(FORMAT列)和纯合子。 如果存在基因型数据,则每个样本打印一行,而表示为VCF_SAMPLE_ID的列表示给定样本的数据。 脚本具有以下可选参数 跳过样本基因型数据(即FORMAT列) 保留拒绝的基因型(即FILTER\uff01='PASS'/ GT =='./。') 跳过INFO数据。 压缩输出TSV 将VCF列的数据类型打印为标题行 重要信息:如果使用大型多样本VCF文件运行vcf2tsv,则输出TSV的大小将Swift增大,因为默认情
2022-12-29 09:27:44 5KB tsv conversion vcf vcf-data
1