wgs全基因组序列比对流程 用到的软件 过程步骤 一. 下载准备需要的文件 下载参考序列基因组文件 1.建立索引 bwa index ref.fasta 完成之后 会看到几个ref.fasta为前缀的文件 为参考序列生成dict文件 gatk CreateSequenceDictionary -R ref.fasta -O ref.dict samtools 建索引 samtools faidx ref.fasta 下载测序文件 fastaq-dump --split-files SRR***** 下载的文件是双末端测序从两端读的read1和read2 >> 用bgzip压缩 bgzip seq1_.fasta bgzip seq2_.fasta 二.处理文件 将read比对到参考基因组 bwa mem -t 4 -R '@RG\tID:foo\tPL:illumina\tSM:
2022-10-07 09:31:29 37KB HTML
1
表观基因组学生物导体 背景:我为名为“基因组数据科学的生物导体”的Coursera课程的第一个作业编写了名为“ HW1.R”的R脚本。 关于: R脚本使用AnnotationHub程序包获取有关人类CpG岛和组蛋白修饰(H3K4me3和H3K27me3)的数据。 R脚本使用GenomicRanges程序包通过执行以下操作来从数据中提取基本统计信息:按染色体分组范围,子集,相交,查找范围重叠,调整范围大小,创建列联表以及计算优势比。 软件: R版本4.0.4(2021-02-15)。 生物导体版本3.12。 AnnotationHub。 基因组范围。 rtracklayer。
2022-10-05 13:19:50 3KB R
1
igv截图 使用 IGV 创建基因组区域的静态屏幕截图。 ##精简版 为每个样本创建一个目录,其中包含一个 IGV XML 文件和您希望查看的基因组站点的床文件。 从该目录,使用 bash igvCreateBatchFiles.sh 创建批处理文件 然后,要为 LSF 集群上的每个示例创建屏幕截图,请运行 for i in *.igv;do bsub -oo err.log -q long -M 12000000 -R 'select[mem>12000] rusage[mem=12000]' "bash ~cmiller/oneoffs/igvCreateSnapshots.sh $i"; done 您的屏幕截图将存储在 SAMPLENAME_snaps 中,看起来类似于下面附加的缩略图。 我喜欢 geeqie 程序可以快速浏览它们。 您可以使用“sudo apt-g
2022-09-08 21:47:28 4KB Shell
1
QUAST执行快速方便的质量评估和基因组装配比较。 QUAST计算了许多众所周知的指标,包括重叠群准确性,发现的基因数量,N50和其他指标,以及引入了新的指标,例如NA50(请参见本文和手册中的详细信息)。 全面的分析得出汇总表(纯文本,制表符分隔和LaTeX格式)和彩色图表。 该工具还可以生成基于Web的报告,将所有信息压缩到一个易于浏览的文件中。 QUAST具有直观的命令行界面和详细的手册,可帮助用户运行它并了解其输出。 此外,实验室在http://quast.bioinf.spbau.ru/上启动了Web-QUAST的Beta版,这使质量评估更加简单。 QUAST和MetaQUAST(宏基因组程序集的扩展名)论文发表在《生物信息学》上。
2022-08-26 09:26:47 32.63MB 开源软件
1
EMMCKmer Ëpigenetic中号etagenomic中号OTIFÇharacterization由k聚体分析 概述 该工具比较基因组中每个现有 kmer 的 NATIVE 和 WGA 数据之间的 IPD 分布(使用对数似然比),然后使用迭代贪婪程序来识别重要的基序。 此工具的输出是经过显着修改的 kmers 列表。 ##Running 要运行代码,只需键入: sh EMMCkmer.sh [wga.cmp.h5] [nat.cmp.h5] [sample id] [fasta file] [output directory] 输入 这个包装器脚本将 NATIVE 和 WGA 数据的 cmp.h5 文件、SAMPLE 名称、参考基因组的 FASTA 文件和 OUTPUT 目录作为输入。 安装/要求 如果您满足以下要求,则不需要安装任何东西: PacBio 分发的 SMRT
2022-08-10 16:13:05 16KB Python
1
基因组片段填充问题的算法研究.pdf
2022-07-11 14:12:27 7.64MB 文档资料
基因组图像数据集.zip
2022-07-04 16:04:52 1.34GB 数据集
概述 AlignGraph 是一种软件,它通过在密切相关生物体的参考基因组提供的帮助下重新组装重叠群或支架来扩展和连接它们。 简短的手册 系统要求 AlignGraph 适用于具有 Linux 操作系统的 32 位或 64 位机器。建议使用至少 4GB 的系统内存来组装更大的数据集。 安装 运行 AlignGraph需要对齐器Bowtie2和BLAT / PBLAT / NUCMER(BLAT 的版本应为 v34 或以下)。 要使用 Bowtie2 和 BLAT/PBLAT/NUCMER,请将它们放入您的 $PATH:export PATH=PATH2BOWTIE2:$PATH和export PATH=PATH2BLAT/PBLAT/NUCMER:$PATH. 下载的 AlignGraph.cpp 文件可以用命令编译g++ -o AlignGraph AlignGraph.cpp -lpthread。 输入 双端 DNA 以 FASTA 格式读取。 由任何从头 DNA-Seq 组装器(Velvet、ABySS、ALLPATHS-LG、SOAPdenovo 等)组装的从头重叠
2022-06-10 18:05:02 229KB assembly 算法
国科大《基因组分析技术与原理》2019年春季学期期末考试试题。
1
蛋白质组分析数据库-InterPro-和CluSTr在全基因组蛋白质功能分类方面-
2022-06-06 14:06:57 39KB 文档资料 数据库 分类 database