phyloFlash v3.4 由Harald Gruber-Vodicka,Elmar A. Pruesse和Brandon Seah撰写。 phyloFlash是快速重建SSU rRNA并探索Illumina(元)基因组或转录组数据集系统发育组成的管道。 注意版本3更改了一些输入选项,还更改了如何处理基于映射的分类单元(NTU)。 请下载旧版本的v2.0的最新版本( )。 没有对数据库设置进行任何更改,因此为v2.0准备的数据库仍可用于v3.0。 请阅读上phyloFlash。 快速开始 通过Conda下载 是一个程序包管理器,如果您还没有依赖关系,它还将安装所需的依赖关系。 phyloFlash通过Conda上的渠道进行分发。 根据,建议同时安装所有软件包,以避免依赖冲突,并创建新的环境而不是安装到基本环境。 # If you haven't set up Biocon
2022-12-05 16:02:00 16.88MB Perl
1
基因组数据分析(GDA) 朱利奥·卡拉瓦尼亚( )( )3/5/2021 数据科学和科学计算理学硕士课程。 意大利的里雅斯特大学 3CFU-24小时,12节课,每节2小时。 50%的理论课,50%的实践课(每次40')。 GitHub: : 讲师 Giulio Caravagna博士 特邀讲师 里雅斯特大学Riccardo Bergamin博士 CNR的Alex Graudenzi博士。 的里雅斯特大学Salvatore Milite博士 米兰比可卡大学的Daniele Ramazzotti博士。 程序 讲师 标题 什么时候 卡拉瓦尼亚 批量测序的变体调用 9/4 卡拉瓦尼亚 通过批量测序测量非整倍性 12/4 卡拉瓦尼亚 躯体电话的综合质量控制 16/4 佛手柑 癌症的人口遗传学 19/4 卡拉瓦尼亚 肿瘤亚克隆反卷积 21/4 拉马佐蒂 体细胞突变特征 23
2022-11-27 22:14:46 331.39MB HTML
1
Parallel-META 2.0:具有功能注释,高性能计算和高级可视化功能的增强型元基因组数据分析
2022-05-21 00:46:32 1.72MB 研究论文
1
早期的癌症预测非常重要,因为患者可以准备应对它。 有几种机器学习模型可以通过识别高风险的独立样本来帮助预测癌症,从而简化癌症试验的设计和规划。 这些模型使用生物标志物(例如年龄,更年期,肿瘤大小,肿瘤,乳房,乳房四分之一尺度)来预测乳腺癌。 但是,这些模型的主要缺点是后期预测以及准确性低。 因此,在这里介绍一种使用基因表达谱(基因组数据)来早期预测乳腺癌的系统。 该模型是使用不同的机器学习算法构建的,例如高度通用的支持向量机(SVM),朴素贝叶斯定理,决策树和最近邻居方法,可使用基因表达谱预测乳腺癌。
2022-05-14 18:15:28 318KB SVM (Support Vector Machine)
1
GC计算 从基因组数据中计算 GC 含量和 GC 偏斜的 circos 格式数据。 用法 用法:GCcalc.py -f input.fa [-w 1000] [-s 1000] 选项:-h, --help 显示此帮助信息并退出 -f FASTA, --file=FASTA Input Fasta format file -w WINDOWSIZE, --window=WINDOWSIZE default:1000 WindowSize to calculate -s STEPSIZE, --step=STEPSIZE default:1000 StepSize for slide widows
2022-03-30 16:28:46 9KB Python
1
Geneview:用于基因组数据可视化的python软件包 Geneview是基于matplotlib的Python可视化库。 它提供了用于绘制有吸引力的基因组图形的高级界面。 现在它正在积极开发。 文献资料 例子 我们使用存储库中的数据集GOYA_preview作为以下图的输入。 这是GOYA_preview的格式预览: 曼哈顿情节的基本示例。 import matplotlib.pyplot as plt import geneview as gv df = gv.util.load_dataset('GOYA_preview') # df is DataFrame of pand
2022-02-25 19:05:38 17.94MB visualization python pandas data-visualization
1
基因组数据可用性的激增有望确定观察到的个体性状的遗传原因,并将其应用于发现表型的遗传根源等问题,无论是基因表达或代谢物浓度等分子表型,还是疾病等复杂表型。然而,这些数据集的规模不断扩大,以及相关算法的二次、三次或更高的缩放特性,带来了严重的计算挑战,需要使用领导力规模计算。在本文中,我们描述了一种执行向量相似性度量计算的新方法,适用于配备图形处理单元(GPU)或英特尔至强Phi处理器的并行系统。我们主要关注应用于全基因组关联研究(GWAS)和全表型关联研究(PheWAS)的比例相似性度量。我们描述了算法在加速处理器上的实现,用于消除对称性导致的冗余计算的方法,以及将计算有效映射到多节点并行系统的技术。 结果表明,在ORNL Titan系统上,每节点的高性能和并行可扩展性,每秒的元素比较速率超过5万亿(5×1015)。在一篇配套论文中,我们描述了用于计算比较基因组学应用的自定义相关系数的相应技术。
2022-02-09 18:01:59 3.98MB 基因组数据
基因组数据已广泛应用于科学研究、医疗服务、法律与取证和直接面向消费者服务.基因组数据不但可以唯一标识个体,而且与遗传、健康、表型和血缘关系密切关联.此外,基因组数据具有不随时间而变化的稳定性.
2021-08-08 18:10:16 2.79MB #资源分享达人计划# 基因组数据
1
微生物全基因组数据分析相关内容.mp4
1
Fourfront元数据数据库 概述 这是来自的分支。 我们正在努力使该项目模块化,并适应我们对4D Nucleome项目的需求。 安装 已知Fourfront可与Python 3.6.x一起使用,而不适用于Python 3.7或更高版本。 如果是4DN小组的成员,建议使用Python 3.4.3,因为这是我们服务器上运行的内容。 在执行以下步骤之前,最好的做法是使用这些版本之一创建一个全新的Python virtualenv。 步骤0:取得凭证 获取AWS密钥。 这些将需要添加到您的环境变量中,或通过AWS CLI(在此过程的后面安装)添加。 步骤1:自行验证自制程序 验证自制程序是否正常工作: $ brew doctor 步骤2:安装自制的依赖项 安装或更新依赖项: $ brew install libevent libmagic libxml2 libxslt openssl p
2021-02-23 09:05:06 7.91MB JavaScript
1