本书是国内第一本系统介绍R语言及Bioconductor软件包的图书。R是一种计算机程序设计语言,也是一个开放式的软件开发平台。R具有强大的数学统计分析和科学数据可视化功能,提供各种数据处理、统计分析及图形显示工具。软件研究人员可以在R这个开放平台上不断扩充R的功能,开发出面向特定应用的软件。Bioconductor就是一个基于R的、面向基因组信息分析的应用软件集合。Bioconductor的应用功能主要是以包的集成形式呈现在用户面前,它提供的软件包中包括各种基因组数据分析和注释工具,其中大多数工具是针对基因芯片或DNA微阵列数据的处理、分析、注释及可视化。同时,Bioconductor还提供许多与DNA微阵列相关的数据包。《R语言及Bioconductor在基因组分析中的应用》面向计算机应用人员,特别是针对从事数学统计分析和生物信息学研究及应用的有关人员,着重介绍R语言和Bioconductor的基本用法及技术,并提供许多精简的程序实例,为读者了解和熟练使用R语言和Bioconductor提供帮助。
2021-12-05 11:40:05 45.02MB R语言应用
1
RADseq人口基因组学 奥本大学生物学家脚本课程开发了一种用于RADseq数据的群体基因组分析的管道。 入门 目标 我们的开发流程旨在使用户从从定序器获得与限制性酶切位点相关的DNA序列(RADseq)数据的步骤,到总体基因组推断的起始步骤。 具体地,我们已提供了书面在壳和R 1至解复用的序列数据的脚本和组装位点具有Stacks ,估计人口结构与两个参数和非参数人口的聚类方法( Admixture和adegenet ),并推断人口结构下面的空间直观具有conStruct模型。 数据 在TM收集的来自276个来自巴哈马,海地和多米尼加共和国的Anolis distichus蜥蜴的双消化RADseq(ddRADseq)数据集上,测试了使用Stacks解复用和组合原始序列数据的脚本。 我们还下载了从RADseq协议获得的基因组数据,并使用两个最流行的RADseq组装程序之一Stacks和Py
2021-12-01 15:10:58 1.43MB R
1
人类参考基因组 一、人类参考基因组的来源 1、人类基因组计划 1)2001年草图,绘制人类基因组图谱 2、数据库的名称 1)UCSC:hg19,hg38 2)NCBI:GRCH19,GRCH38 二、如何下载参考基因组 在 linux 中下载参考序列数据库: 1. hg38:wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz 2. hg19:wget http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz # 下载时间会比
2021-11-25 13:40:33 85KB 基因 基因组
1
基因组检测与遗传病筛查.ppt
2021-11-17 09:02:48 8.37MB
Krait:微卫星研究和引物设计 目录 介绍 Krait是一款功能强大且超快速的工具,具有用户友好的图形界面,可用于全基因组范围内的微卫星研究,从而试图克服当前可用工具的局限性。 Krait用Python编写,可以在Windows,Linux或Mac系统上作为独立的桌面应用程序运行而无需依赖。 微卫星搜索引擎用C编写,并编译为Python模块,以导入到Krait中 特征 确定完美的SSR 识别不完善的SSR(iSSR) 化合物SSR(cSSR)的鉴定 从超大型基因组中鉴定VNTR 在基因编码区定位SSR 微卫星设计入门 统计分析和绘图 支持gzip压缩的fasta作为输入文件 支持导出FASTA,GFF3或CSV 从NCBI数据库下载DNA序列 下载 https://github.com/lmdu/krait/releases 文献资料 http://krait.bios
2021-11-09 21:44:16 26.62MB primer repeats microsatellite tandem
1
瓦吉诺 用于全基因组测序数据和大型SNP数据库的Fase SNP基因分型工具。 从Bioconda安装 可以使用命令conda install vargeno从Bioconda conda install vargeno 。 请转到以获取有关Bioconda的更多信息。 如果您尚未 ,则可以 。 快速使用 VarGeno作为输入: FASTA文件格式的参考基因组序列。 以VCF文件格式进行基因分型的SNP列表。 以FASTQ文件格式从供体基因组测序测序。 在对个体进行基因分型之前,必须使用以下命令为参考和SNP列表构建索引: vargeno index ref.fa snp.vc
2021-11-06 12:07:32 21.67MB bioinformatics snps algorithms computational-biology
1
文章目录MEGAN-宏基因组功能和物种分类MEGAN功能简介原理简要示意图MEGAN特有文件格式:RMAMEGAN下载MEGAN使用MEGAN(linux版本安装)MEGAN使用指南(Linux)提取注释内容(物种和功能):提取物种注释数据:提取功能:Win版安装和使用MEGAN安装Win版使用指南MEGAN主界面介绍MEGAN输入介绍MEGAN分析进阶双样本比对MEGAN界面可视化-两样本(.rma)比对物种信息可视化功能信息可视化数据导出MEGAN多个样本分析方案猜你喜欢写在后面 有时间可以写一个megan的中文教程。详细介绍软件、数据库安装,示例数据分析和结果描述。这个也引用了几千次,可
2021-11-04 16:19:16 1.7MB 分类数据 可视化 基因
1
OrthoFinder, 对orthologous基因组的准确推断 OrthoFinder" OrthoFinder - 精确推断 orthogroups 。orthologues 。基因树和根species树 ! 图1: 图2: 自动的OrthoFinder分析工具:做什么?OrthoFinder是比较基因组学的快速。准
2021-11-02 16:29:26 47.23MB 开源
1
CEGMA v2.5 自述文件 发布时间:2014-05-19 内容 A. 什么是 CEGMA? B. 安装 CEGMA C. 文件列表 D. 编制 CEGMA E. 运行 CEGMA F. 作者和帮助 G. 引用 CEGMA A. 什么是 CEGMA? CEGMA(核心真核基因图谱方法)是一种用于在几乎任何真核基因组中构建一组高度可靠的基因注释的管道。 该策略依赖于一个简单的事实:一些高度保守的蛋白质基本上在所有真核基因组中都被编码。 我们使用 KOGs 数据库来构建一组这些高度保守的普遍存在的蛋白质。 我们定义了一组 458 个核心蛋白,以及 CEGMA 协议,以在新基因组中找到核心蛋白的直向同源物并确定它们的外显子-内含子结构。 本地版本的 CEGMA 可以安装在 UNIX 平台上,它需要预先安装 Perl、NCBI BLAST+、HMMER、GeneWise 和gene
2021-10-27 19:32:15 12.12MB Perl
1
肿瘤基因组图谱及功能系统生物学.ppt
2021-10-19 19:02:21 5.09MB