咖啡店 软件基因˚F爱米莉Ë旋涡的Çomputational一nalysis CAFE的目的是通过解释系统进化史并为进化推论提供统计基础的方式来分析基因家族大小的变化。 该程序使用生与死过程来模拟用户指定的系统发育树中的基因得失。 在此模型下生成的家庭规模分布可为评估观察到的分类单元之间家庭规模差异的重要性提供基础。 到 CAFE v4.2.1是CAFE应用程序常规发行版中的最新版本。 该手册和各种教程可以在网站( )上查看。 本文档介绍了如何下载和使用CAFE v4.2.1。 用 CAFE v4.2.1的必要输入是: 一个数据文件,包含系统发育树中包含的分类单元的基因家族大小 Newick格式的系统发育树,包括分支长度 根据以上输入,CAFE v4.2.1将计算: 整个树上或树中用户指定的分支子集上的生死参数λ的最大似然值λ(或单独的生死参数(分别为λ和μ)) 系统发育树中
2023-03-19 23:40:17 6.26MB bioinformatics phylogenetics gene-families C++
1
基于深度学习的生物信息学聚类方法 ”期刊的“”中发表的论文“基于深度学习的生物信息学聚类方法”的代码和补充材料。 此仓库将定期更新。 特别是,将添加更完整的Jupyter笔记本。 在本文中,我们回顾了基于深度学习的聚类分析方法,包括网络训练,表示学习,参数优化和制定聚类质量指标。 我们还讨论了在不同的场景(例如生物成像,基因表达聚类)中,基于不同的自动编码器体系结构(例如,香草,变异,LSTM和卷积)的表示学习如何比基于ML的方法(例如,PCA)更有效。 ,以及将生物医学文本聚类。 基于深度学习的无监督/聚类方法,链接到论文和代码 我们提供了基于深度学习的无监督/聚类方法,论文链接和代码的列表。 此外,还将列出提出新方法和论文的文章。 敬请期待! 标题 文章 会议/期刊 代码 卷积自动编码器(DCEC)的深度聚类 ICONIP'2017 用于一致性培训(UDA)的无监督数据增强 Arx
1
Sortmerna SortMeRNA是用于过滤,定位和聚类的本地序列比对工具。 核心算法基于近似种子,可以对NGS读数进行敏感分析。 SortMeRNA的主要应用是从转录组数据中过滤rRNA。 SortMeRNA将读取(fasta,fastq,fasta.gz,fastq.gz)和一个或多个rRNA数据库文件作为输入文件,并将对齐和拒绝的读取分为两个文件。 其他应用程序包括可通过获得的聚类和分类分配。 SortMeRNA可处理Illumina,Ion Torrent和PacBio数据,并可产生SAM和BLAST样的比对。 目录 入门 SortMeRNA 4可以在Linux和Windows
2022-12-17 21:13:14 33.05MB python bioinformatics cpp alignment
1
单倍型比较工具 彼得·克鲁斯(Peter Krusche) 这是一组基于的程序,用于根据金标准真相数据集对变体调用进行基准测试。 要将VCF与黄金标准数据集进行比较,请使用以下命令行执行基因型水平单倍型比较。 hap.py truth.vcf query.vcf -f confident.bed -o output_prefix -r reference.fa 我们还有一个脚本,仅根据染色体,位置和等位基因身份进行比较。 该比较将不会解析单倍型,而只会验证在相同位置观察到了相同的等位基因(例如,用于比较体细胞集合)。 som.py truth.vcf query.vcf -f confident.bed -o output_prefix -r reference.fa 可以在下面的“找到更多信息。 内容 系统要求 硬件 Linux OS X 视窗 其他需求 动机 复杂
2022-12-09 01:06:13 122.82MB bioinformatics genomics vcf vcf-comparison
1
chromVAR:染色质跨区域变异(基因组!)
2022-11-12 15:02:06 571KB bioinformatics dnase-seq r atac-seq
1
图6.14 JMarti线路设置 - 157 -
2022-11-04 08:17:11 3.34MB ATP 用户手册
1
VCF与纯文本GWAS存储格式 以纯文本/表格文本和VCF查询GWAS摘要统计信息的运行时性能 引文 Lyon, M.S., Andrews, S.J., Elsworth, B. et al. The variant call format provides efficient and robust storage of GWAS summary statistics. Genome Biol 22, 32 (2021). https://doi.org/10.1186/s13059-020-02248-0 结果 要查看比较结果,请在网络浏览器中打开html文件。 阴谋 工作流程 将GWAS转换为GWAS-VCF 准备查询 对数据进行二次采样,准备多样本GWAS-VCF,并记录预期的输出结果,以便与命令行工具进行比较 RSID查询性能 rsID上的性能查询 单样本-2.5M 单
2022-11-03 21:05:54 7.08MB performance bioinformatics gwas vcf
1
BLAST(基本局部比对搜索工具)是一种局部比对算法,具有很高的准确度,被广泛使用。 它可以在保持高精度的同时减少程序的运行时间,但是在比较大型基因数据集时却存在性能瓶颈和低效率。 因此,提出了一种基于Spark的分布式并行方法Spark_BLAST。 该方法利用Spark内存计算来识别和划分任务,并实现了BLAST算法的分布式并行计算。 最后,该方法在5个节点的Spark集群上实现。 与单机比较表明,Spark .cluster的加速可以达到约4,而不会改变比较结果的准确性。 该方法为生物信息学提供了一种有效的比对方法。
2022-11-02 15:55:19 732KB Spark Parallel computing Bioinformatics
1
《 Python手册中的生物信息学》,第二版 这是Packt发行的代码库。 了解如何使用现代Python生物信息学库和应用程序进行计算生物学的前沿研究 这本书是关于什么的? 生物信息学是一个活跃的研究领域,它使用一系列简单而先进的计算来从生物数据中提取有价值的信息。 本书涵盖了下一代测序,基因组学,宏基因组学,种群遗传学,系统发育学和蛋白质组学。 您将学习现代的编程技术来分析大量的生物学数据。 借助实际示例,您将使用各种Python工具和库来转换,分析和可视化数据集。 本书涵盖以下激动人心的功能: 了解如何处理大型下一代测序(NGS)数据集 使用FASTQ,BAM和VCF格式处理基因组数据集 学习进行序列比较和系统发育重建 使用Protemics数据执行复杂的分析 使用Python与Galaxy服务器进行交互 如果您觉得这本书适合您,请立即获取! 说明和导航 所有代码都组织在文件
2022-10-20 14:46:49 12.5MB OpenEdgeABL
1
用python编写生物信息学中的程序,生物信息学的同学可以看看,个人感觉还是不错
2022-09-27 10:08:02 6.83MB python 生物信息
1