概述 EggNOG-mapper是一种用于对新序列进行快速功能注释的工具。 它使用来自eggNOG数据库( )的预先计算的直系同源基因组和系统发育树,仅从细粒度直系同源基因中转移功能信息。 eggNOG-mapper的常见用途包括注释新的基因组,转录组甚至宏基因组基因目录。 使用正交预测作为功能注释的方法比传统的同源搜索(即BLAST搜索)具有更高的精度,因为它避免了从紧密的旁系同源物转移注释(重复的基因更有可能参与功能差异)。 将不同的eggNOG-mapper选项与BLAST和InterProScan进行比较的基准。 EggNOG-mapper也可以作为公共在线资源获得: ://eggnog-mapper.embl.de 文献资料 引文 如果您使用此软件,请引用: [1] Fast genome-wide functional annotation through orth
1
Python Materials Genomics(pymatgen)是强大的材料分析代码,它定义了结构和分子的核心对象表示形式,并支持许多电子结构代码。 当前,它是为材料项目提供动力的核心分析代码。 官方文档:http://www.pymatgen.org Pymatgen(Python Materials Genomics)是一个健壮的开源Python库,用于材料分析。 这些是一些主要功能:高度灵活的类,用于表示Element,Site,Molecule,Structure对象。 广泛的输入/输出支持,包括对VASP,ABINIT,CIF,高斯,XYZ和许多其他文件格式的支持。 强大的分析工具,包括相图,Pourbaix图,扩散分析,
2023-01-09 00:48:54 243.92MB Python Miscellaneous
1
单倍型比较工具 彼得·克鲁斯(Peter Krusche) 这是一组基于的程序,用于根据金标准真相数据集对变体调用进行基准测试。 要将VCF与黄金标准数据集进行比较,请使用以下命令行执行基因型水平单倍型比较。 hap.py truth.vcf query.vcf -f confident.bed -o output_prefix -r reference.fa 我们还有一个脚本,仅根据染色体,位置和等位基因身份进行比较。 该比较将不会解析单倍型,而只会验证在相同位置观察到了相同的等位基因(例如,用于比较体细胞集合)。 som.py truth.vcf query.vcf -f confident.bed -o output_prefix -r reference.fa 可以在下面的“找到更多信息。 内容 系统要求 硬件 Linux OS X 视窗 其他需求 动机 复杂
2022-12-09 01:06:13 122.82MB bioinformatics genomics vcf vcf-comparison
1
funannotate是用于基因组注释的管道(专门为真菌构建,但也可用于高级真核生物)。 有关安装,使用和更多信息,请参见 最快启动Docker: 您可以使用funannotate运行funannotate 。 需要注意的是,GeneMark不包含在Docker映像中(请参阅下面的许可,您可以向开发人员投诉,因为它难以分发/使用)。 我还编写了一个bash脚本,该脚本可以运行docker映像并自动检测/包括正确的用户/卷绑定。 该docker映像是基于master中的最新代码构建的,因此它将早于标记的发行版。 该映像还包括所需的数据库,如果您只想在没有数据库的情况下进行注解,则该映像位于nextgenusfs/funannotate-slim hub以及nextgenusfs/funannotate-slim 。 因此,可以通过以下方式实现此路线: # download/pull th
1
msprime msprime是一个Python API和命令行界面,用于基于重组模拟合并。 请参阅以获取更多信息和。 如果您想帮助使msprime更好,请参阅以开始使用。 如果您正在寻求有关特定问题的帮助,或者想向其他msprime用户提出问题,请发送电子邮件至。 通过在邮件列表中提问,您可以帮助建立可搜索的知识库。 我们目前正在努力开发1.0版本,问题的路线图在。 如果您在工作中使用msprime ,请引用论文。 有关完整的引文详细信息,请参见。
2022-10-25 09:34:40 808KB python genomics genetics simulation
1
qqman:一个R包,用于根据GWAS结果创建QQ和曼哈顿图
2022-10-09 20:01:28 4.1MB cran gwas r genomics
1
入门 git clone https://github.com/lh3/kmer-cnt cd kmer-cnt make # C++11 required to compile the two C++ implementations wget https://github.com/lh3/kmer-cnt/releases/download/v0.1/M_abscessus_HiSeq_10M.fa.gz ./yak-count M_abscessus_HiSeq_10M.fa.gz > kc-c4.out 介绍 K-mer计数是许多作图者,组装者和其他工具(例如基因分型仪,宏基因组学分析仪等)的基础。 它是生物信息学中最重要的算法类别之一。 在这里,我们将实现基本的k-mer计数算法,但具有高级工程技巧。 我们将看到更好的工程技术可以走多远。 在此仓库中,每个{kc,yak}-*.
2022-05-21 16:51:08 47KB bioinformatics genomics k-mer-counting C++
1
scNym-用于单细胞分类的半监督对抗神经网络 scNym是一个神经网络模型,用于根据单细胞分析数据(例如scRNA-seq)预测细胞类型,并从这些模型中得出细胞类型表示形式。 尽管细胞类型分类是主要的用例,但是这些模型可以将单个细胞概况映射到任意输出类别(例如实验条件)。 我们已经在Genome Research的最新论文中详细描述了scNym 。 如果您发现此工具有用,请引用我们的工作。 我们也有一个研究网站,介绍scNym简报- 用于单细胞分类的半监督对抗神经网络。 雅各布·金梅尔(Jacob C.Kimmel)和大卫·凯利(David R.Kelley)。 基因组研究。 2021. doi: : BibTeX @article{kimmel_scnym_2021, title = {Semi-supervised adversarial neural networ
1
ccle-2019-分析 最新的《癌细胞系百科全书》(CCLE)v2论文中的计算分析演练,该论文于2019年5月在《。 另请参阅和相关。
2021-08-24 15:24:29 20.35MB data-science bioinformatics genomics cancer
1
可扩展且灵活的概率PCA用于大规模遗传变异数据 笔记: 现在不维护该存储库。 请检查 我们提出了一种可扩展且精确的算法来计算遗传变异数据的主要成分。 我们的方法基于先前提出的概率PCA,PPCA的潜在变量模型(Roweis,1999; Tipping和Bishop,1999),其中PCA出现在小方差极限内。 潜在变量模型公式化导致了一种迭代EM算法,该算法用于计算具有时间复杂度O(KMN)的主成分,以每次迭代计算N个个体和M个SNP上的K个主成分。 入门 这些说明将为您提供在本地计算机上运行并运行的项目的副本,以进行开发和测试。 先决条件 在Linux机器上,需要以下软件包才能编译和使用软件包。 g++ cmake make 正在安装 安装FastPPCA非常简单。 只需在linux机器上发出以下命令 git clone https://github.com/aman71197/fa
2021-07-21 09:24:23 2.13MB machine-learning genomics pca C++
1