越来越多的巨大全基因组 (>1G) 的序列可用性不断增加,击败了当前现有的 SSR 分析工具。 Genome-wide Microsatellite Analyzing Tool (GMATo) 是一个新的强大的程序,用于更快地挖掘任何长度、任何大小的 SSR,以及基因组方面的全面统计分析,专为基于 Perl 脚本的巨大基因组而设计。 只需要一个输入文件,其中包含原始 fasta 格式的 DNA 序列和表格格式的输出文件,列出所有 SSR 位点信息和四个生物学家感兴趣的分类的统计分布。 GMATo 还具有 Java 脚本的简单图形用户界面和 Perl 的命令行界面,可在 Windows、Linux 和 Mac 等平台上运行,为生物学家和生物信息学家提供易于定制的参数控制。 软件 GMATo 是在巨大基因组中进行 SSR 表征的更好工具 引用本文:Wang X. et al , Bioinformation [2013, 9(10):541-544]
2023-03-19 15:36:05 662KB 开源软件
1
Abstract The style-based GAN architecture (StyleGAN) yields state-of-the-art results in data-driven unconditional generative image modeling. We expose and analyze several of its characteristic artifacts, and propose changes in both model architecture and training methods to address them. In particular, we redesign generator normalization, revisit progressive growing, and regularize the generator to encourage good conditioning in the mapping from latent vectors to images. In addition to improving image quality, this path length regularizer yields the additional benefit that the generator becomes significantly easier to invert. This makes it possible to reliably detect if an image is generated by a particular network. We furthermore visualize how well the generator utilizes its output resolution, and identify a capacity problem, motivating us to train larger models for additional quality improvements. Overall, our improved model rede- fines the state of the art in unconditional image modeling, both in terms of existing distribution quality metrics as well as perceived image quality.
1
分析神经时间序列 2021年1月更新:我将清理现有文件,更新为python3,并在有时间的时候完成其余章节。 要求:Python> = 3.6,numpy> = 1.15,scipy> = 1.5,matplotlib> = 3.2,scikit-image> = 0.17 分析神经时间序列(2012)的Python(Jupyter笔记本)实现。 迈克·科恩(Mike Cohen)撰写的《分析神经时间序列》是一本很棒的书,专为处理连续神经数据的神经科学家撰写。 尽管看起来这本书主要是为脑电图分析而写的,但我发现书中的主题很容易翻译成需要连续数据信号处理的任何领域。 每章介绍一种新技术,重点放在概念而不是严格的数学上,甚至在每章末尾都有摘要,并在本文的“方法”部分中介绍了如何描述分析的技巧。 如果有什么问题,请告诉我。 去做: 第6章清理 第9章清理 第10章清理 第11章清
2022-06-21 22:29:57 17.95MB python timeseries jupyter analysis
1
考试系统毕业设计项目含源码项目:分析纽约市高中数据 美国教育体系中最具争议的问题之一是标准化考试的有效性,以及它们是否对某些群体不公平。 鉴于我们对这个主题的先验知识,调查 SAT 分数和人口统计数据之间的相关性可能是一个有趣的角度。 我们可以将 SAT 分数与种族、性别、收入等因素相关联。 SAT 或 Scholastic Aptitude Test,是美国高中生在申请大学之前参加的一项考试。 大学在决定录取谁时会考虑考试成绩,因此在考试成绩上表现出色是相当重要的。 测试由三个部分组成,每个部分有 800 个可能的分数。 总分超过 2,400 分(虽然这个数字已经改变了几次,但我们项目的数据集基于 2,400 总分)。 组织通常根据平均 SAT 分数对高中进行排名。 分数也被视为衡量整体学区质量的指标。 纽约市在网上提供,以及 . SAT 数据的前几行如下所示: 不幸的是,结合这两个数据集不会为我们提供我们想要使用的所有人口统计信息。 我们需要用其他来源补充我们的数据以进行全面分析。 同一个网站有几个相关的数据集,涵盖人口统计信息和考试成绩。 以下是我们将使用的所有数据集的链接: 按
2022-05-26 11:24:47 4.67MB 系统开源
1
考试系统毕业设计项目含源码出于本项目的目的,我们将使用有关纽约市公立学校的数据。 介绍: 美国教育体系中最具争议的问题之一是标准化考试的有效性,以及它们是否对某些群体不公平。 SAT 或 Scholastic Aptitude Test,是美国高中生在申请大学之前参加的一项考试。 大学在决定录取谁时会考虑考试成绩,因此在考试成绩上表现出色是相当重要的。 测试由三个部分组成,每个部分有 800 个可能的分数。 总分超过 2,400 分(虽然这个数字已经改变了几次,但我们项目的数据集基于 2,400 总分)。 组织通常根据平均 SAT 分数对高中进行排名。 分数也被视为衡量整体学区质量的指标。 我们需要用其他来源补充我们的数据以进行全面分析。 同一个网站有几个相关的数据集,涵盖人口统计信息和考试成绩。 以下是我们将使用的所有数据集的链接: 按学校划分的 SAT 分数 - 纽约市每所高中的 SAT 分数 学校出勤 - 纽约市每所学校的出勤信息 班级规模 - 每所学校班级规模的信息 AP 考试成绩 - 每所高中的大学预修 (AP) 考试成绩(通过特定科目的可选 AP 考试可以获得该科目的学生大
2022-05-16 16:19:27 4.72MB 系统开源
1
Analyzing_Neural_Time_Series, 神经时间序列教材的python 实现 Analyzing_Neural_Time_Series麦克斯 with ( 2014 )的神经时间序列是一本为神经学家编写连续神经数据的大书。 虽然这本书看起来主要是用于脑电分析,但是我发现书中的主题很容易翻译。 每章都介绍了一种新技
2022-05-09 15:45:07 17.95MB 开源
1
Analyzing Business Data with Excel
2022-03-02 15:42:40 6.48MB Excel Analyzing
1
介绍如何使用excel 2003来分析商业数据,介绍很多excel的函数。
2022-03-02 15:37:25 6.45MB excel data analyze
1
pubg-analyzing 绝地求生游戏数据分析 pubg_data_analyzsis.py为数据的探索性分析(EDA)代码 pubg_ml.py是关于这个数据集做的机器学习代码 load_several_data.py用于读取多份文件的方法 绝地求生游戏数据分析.pdf为此次项目的介绍与分析过程 数据集地址: 源数据有aggregate.zip和deaths.zip两类,分别是赛事信息数据与玩家死亡数据 本项目选取了aggregate.zip里面720000场比赛数据中的150000场左右作为分析数据
2021-12-30 15:47:25 1.33MB Python
1
本书提供了对自然语言处理的高度可理解的介绍,自然语言处理是支持各种语言技术的领域,从预测性文本和电子邮件过滤到自动摘要和翻译。
2021-12-01 13:38:28 81B 计算机科学
1