#GenomicsFeatures ###基因组学特征矩阵分析 该项目包含一个用 Python 编写的 Google App Engine 应用程序,该应用程序执行以下任务: 将 tsv 格式的n x m特征矩阵转换为 csv 格式的文件,其中包含n x m行元组(特征、样本、值) - run_fmx_convert.py 在 Datastore 中为此数据构建模型 - model.py 运行一个仅限地图的 MapReduce 作业,将您从 GCS 转换的 csv 文件导入模型 - pipeline.py 也可以通过bulkload 机制导入数据,但速度很慢。 - run_upload_data.sh 在特征名称上定义和构建全文搜索索引。 - 搜索search.py 提供允许您执行以下操作的用户界面:- main.py 执行上面列出的大部分管理任务。 使用全文搜索查找特征。
2021-07-03 09:10:11 403KB Python
1
缅甸蟒线粒体基因组全序列测定与分析.pdf
2021-06-29 15:03:40 686KB Python 程序 数据处理 专业指导
比较详细地介绍基因组测序流程
2021-06-27 08:33:13 3.32MB 流程
1
##自述## 用于创建病毒和宏基因组数据库的软件程序/工具 作者:Sanjeev Kulshreshtha ( ) 日期:08/15/2011 ##为什么选择这个程序?## 有必要在 JCVI 创建一个数据库,用于系统发育分析与 umbrealla APIS 整合所需的宏基因组序列JCVI 的数据库进行比较分析。 ##这个程序有什么作用?## 该软件程序自动创建一个包含病毒基因组的数据库和微生物宏基因组表达序列数据来自各种公共生物数据库。 可以使用 SQL 查询查看数据库GUI 界面或直接在 Unix、linux 或 PC 内核上。 ##这个程序是如何运作的?## 该程序提取、解析并生成加载 int 的最终数据数据库。 使用预先定义的标准处理和验证数据之前传输到数据库。 只有当公布的肽段数据和它自己的翻译后的肽序列数据匹配,然后只加载数据数据库。 该程序使用的数据库架构和格
2021-06-21 18:10:38 14KB Perl
1
本书分为上下两篇,分别介绍R语言和Bioconductor。在本书的上篇,从计算机语言的实际应用出发,逐步介绍R语言的特点、使用、基本数据结构、对象、数据分组、数组和矩阵、数据列表和数据单、函数包,统计分析、图形和可视化。本书的下篇介绍了包括DNA微阵列相关技术、数据预处理方法、基因表达差异的显著性分析、基因表达谱的聚类分析和分类识别等内容。
2021-06-13 20:39:13 45.02MB R语言
1
基因组多义词和同义词 版权所有 :copyright: 2015,威斯康星大学董事会。 仅授予非营利用途的使用权。 Genome Polysemy and Synonymy (GPS) 是一个可视化平台,用于分析光学图谱、光学重叠群和从序列数据创建的计算机限制图谱之间的比对。
2021-06-11 11:06:19 811KB Java
1
3dna 从您的基因组生成可打印的 3D 模型。 ###要求 染色体文件(3dna 是使用来自文件设计的,但其他来源可能是类似的?) 一台 3D 打印机(这不是使用 3dna 所必需的,但它使它更有趣) ###基本用法 获取基因组文件(如果您使用 23andme,可以)。 然后运行以下命令: python 3dna.py genomefile.txt 100 > genome.scad 这将生成一个可以在 OpenSCAD 中打开的模型文件。 打开这个文件,选择Design -> Compile and Render ,然后选择Design -> Export as STL并选择一个位置来保存文件。 然后可以将 STL 文件切片并使用您选择的 3d 打印机打印。 ###细节 3dna.py 脚本的第一个参数是要处理的基因组文件的文件名。 第二个参数是要处理的“分辨率”。 处
2021-06-02 20:02:53 970KB OpenSCAD
1
超级英雄 MEGAHIT是一种超快速且高效存储的NGS汇编器。 它针对元基因组进行了优化,但在通用的单基因组装配(小或哺乳动物大小)和单细胞装配上也能很好地工作。 安装 conda conda install -c bioconda megahit 适用于x86_64 Linux的预构建二进制文件 wget https://github.com/voutcn/megahit/releases/download/v1.2.9/MEGAHIT-1.2.9-Linux-x86_64-static.tar.gz tar zvxf MEGAHIT-1.2.9-Linux-x86_64-static.t
1
原始基因组序列经常被其他生物的序列污染。 它们的鉴定对于基因组数据的解释是必不可少的。 在这种情况下,必须区分水平基因转移和污染。 序列的基因组背景可以帮助区分这两种情况。 分类细胞将基因组支架分成确定长度的子序列,并为每个子序列确定最接近的相关分类单元。 然后,它考虑到分类本体论,总结了整个支架的信息。 可以完全去除与潜在污染物完全匹配的支架,而与部分污染物和部分目标生物匹配的序列可能构成水平转移或装配伪像,需要手动检查。
2021-04-29 17:05:24 70KB 开源软件
1
基因组数据库,1.3G,包括图像,数据太大,放在百度网盘,资源内附链接和密码
2021-04-19 21:06:28 130B image data
1