用于构建De Bruijn图的JumboDB工具
版本:1.0.1
这是jumboDB工具,可用于从很长的序列(读数或基因组)中以极低的错误率快速构建de Bruijn图。 JumboDB本身不是一个基因组组装程序,而是一个子例程,该例程将一组读取结果转换为压缩的de Bruijn图。 JumboDB是正在开发中的LJA(拉荷亚组装程序)基因组组装程序的一部分,专为HiFi读取组装而设计。 jumboDB的独特之处在于它可以为任何k值构造de Bruijn图。 而且,增加k不会导致时间和空间需求的显着增加。 时间和空间性能主要取决于生成的图形的大小(核苷酸中所有边的总长度)。
请注意,jumboDB会丢弃所有少于k + w的读取(请参见)。
JumboDB使用多种已知技术的组合,例如,bloom过滤器,稀疏的Bruijn图和滚动哈希。 JumboDB从HiFi数据集构建人类基因组的d
2022-05-05 12:35:41
70KB
C++
1