飞行数据分析 我们的数据集包含有关2013年从纽约出发的所有航班的信息,总共包含约336,776个航班。 软件和库: Jupyter笔记本 Python 3.x 脾气暴躁的 大熊猫 MatplotLib 海生 熊猫分析 该数据集由以下变量组成: 年:2013 月:1-12 日期:每月的某天(1-31) dep_time:出发时间,当地时区 sched_dep_time:预定出发时间 dep_delay:出发延迟时间(以分钟为单位),负数表示提早出发 arr_time:到达时间,本地时区 sched_arr_time:预定到达时间 arr_delay:到达延迟(以分钟为单位),负数表示提前到达 载体:两个字母的缩写 航班:航班号 tailnum:平面尾号 原点:原点的机场代码 dest:目的地的机场代码 air_time:在空中停留的时间,以分钟为单位 距离:飞行距离,以英里
2021-10-25 19:35:34 486KB JupyterNotebook
1
英国脱欧公投日富时100高频数据分析 抽象的 本文涉及使用随机过程中的布朗运动来估计波动率。该模型遵循随时间变化的布朗运动的形式:$ dP_ {t} = \ mu_ {t} dt + \ sigma_ {t} dB_ {t} $,其中$ P_ {t} $表示对数价格,$ dP_ {t} $是收益,$ \ sigma_ {t} $是半-。根据[@ Alvarez2011]的研究,瞬时波动率由Semi-martingale $ \ sigma ^ {(p = 2)} _ {t} $计算得出,其中$ p = 2 $是二次方差。随时间变化的布朗运动模型包括波动率,其中当股价,尤其是买入和卖出反弹中的微观结构噪声已显示出来时,估计员会提供波动性。瞬时波动率是根据时间相关的布朗运动模型建立的,瞬时波动率具有估计量。在不同时间间隔内从英国股票指数,FTSE 100的买入和卖出价等高频数据中发现的已实现波
2021-10-22 11:39:25 3.24MB
1
蛇管 snakePipes是使用构建的灵活而强大的工作流程,可简化NGS数据的分析。 可用的工作流程 DNA映射* 芯片序列* mRNA序列* 非编码RNA-seq * ATAC序列* 核糖核酸序列 嗝 全基因组亚硫酸氢盐Seq / WGBS (*在“等位基因特定”模式下也可用) 安装 Snakepipes使用conda进行安装和相关性解析,因此您需要先 。 之后,只需运行以下命令: conda create -n snakePipes -c mpi-ie -c bioconda -c conda-forge snakePipes 这将创建一个新的conda环境,称为“ snakePipes”,其中安装了snakePipes。 然后,您将需要创建各种工作流程所需的conda环境。 为方便起见,我们提供了snakePipes命令: conda activate snak
2021-10-11 15:08:27 20.29MB workflow rna-seq snakemake ngs
1
SQL-for-Data-Analytics:借助SQL的功能执行快速而有效的数据分析
2021-09-26 20:32:32 20.98MB sqlalchemy sql copy datetime
1
brazil_forest_fires 使用来自Kaggle的巴西森林火灾数据集对巴西森林火灾进行数据分析 去做 读取csv文件,并显示。 是一千个运算符 获取数据形状 获取数据的标题 描述数据包括所有 检查是否缺少任何值 将数据分成较小的子集 删除行数为零的行 用nan替换零 用Nan删除行 获取新数据集的形状 描述新的数据集,包括所有 创建数据子集 每月查找森林火灾-按月分组 重新索引生成的序列-我们需要将月份保存在唯一列表中 每月将目录林转换为数据框 使用googletrans将月份翻译成英文 剧情
2021-09-17 20:14:35 32KB Python
1
图书馆大数据分析   图书馆大数据分析初始阶段是针对华中科技大学出版社的教材《Python语言程序设计基础》和《R语言程序设计基础》设计的应用案例,项目的目标是收集更多的图书馆大数据分析开源的数据集、需求和实现样本,为开展大数据技术的学习、研究提供实例,也鼓励将本项目的资源应用到实际的图书馆大数据分析。   随着数字化图书馆的运行,图书馆积累了大量的读者借阅书籍、检索文献的数据。随着大数据技术的发展,人们开始关注如何利用这些数据为读者提供更加高级、周到的服务。   在大数据环境下,图书馆及其服务也必将产生新的巨大变化,深层次的服务功能可以通过大数据技术的运用加以实现。主要体现在两个方面:   (1)提供以人为本的个性化服务。在大数据的支持下,髙细腻的个性化服务能够得到更加有效的开展。图书馆可以基于不同个体的个性特点、性格偏好提供定制式的个体服务,如个性化图书推荐。也可根据热门书籍的分析,为
2021-09-12 18:20:59 48.27MB R
1
从Excel开始 项目概况 目的:此分析将显示与启动日期和资金目标有关的不同活动。 分析与挑战 根据启动日期进行结果分析:从Kickstarter工作表创建了一个数据透视表,可以在(按启动日期的剧院结果)工作表中找到数据透视表,根据父类别过滤数据透视表,将数据透视表中的列过滤为仅显示(成功,失败和取消),(年)列将显示(数据处理的转换),在(父类别)和(年)的数据透视表上添加了过滤器。 父类别仅显示(剧院)。 添加了行标签列,该列显示了一年中的月份,并且活动结果按从大到小的顺序进行排序,因此(成功)列成为第一行,创建了折线图,以便数据透视表显示结果与发布月份,折线图称为(基于发布日期的剧院结局)。 基于目标的结果分析:创建了名为(基于目标的结果)的新表,该表包括以下列(目标,成功次数,失败次数,已取消数量,项目总数,成功百分比,失败百分比,已取消百分比),十二行显示以下内容(少于1000,
2021-08-29 18:14:11 2.2MB
1
mogutda :Python中的拓扑数据分析 介绍 mogutda包含Python代码,这些代码演示了在拓扑数据分析(TDA)应用程序中代数拓扑的数值计算。 其核心代码是涉及隐式复数的数值方法,以及对同源性和贝蒂数的估计。 拓扑数据分析旨在研究数据的形状,并从中得出一些见解。 许多机器学习算法都处理距离,这非常有用,但是却错过了数据可能携带的几何信息。 历史 该软件包中的代码是作为我博客中一些帖子的演示而开发的。 它不是设计成Python包,而是教学法的代码集。 (请参阅: 。)但是,代码和博客文章出人意料地流行。 因此,我将代码模块化到包 。 (或相应的存储库: )但是, mogu只是具有很多依赖关系的不相关的数字例程的集合,但是TDA的一部分可以是非常独立的。 为了向其他研究人员和开发人员提供一个独立的程序包,该程序包紧凑(无需加载不必要的替代程序包)并且高效,我决定分别对T
1
COVID-19分析 使用Python在墨西哥进行COVID-19数据分析
2021-07-03 17:21:19 131KB JupyterNotebook
1
含源码,有代码的详细介绍,很详细,都能看懂,稍加改造可用于预测,满足个人需要,很简单,很方便,很易懂,你可以的
2021-06-30 20:34:05 202KB 疫情预测 疫情分析 数据分析 源码
1