调查数据集 介绍: 我选择“ TMDb电影数据集”进行数据分析。 该数据集包含1000多个记录和21列。 它包括有关预算,收入,运行时间,演员,导演,体裁,发行年,电影受欢迎程度,观看者的评分,制作公司等信息。 该数据集可以帮助我们了解各种因素,例如过去几年的流派趋势,获利能力,过去几年的热门电影,过去几年的平均放映时间,顶尖导演和演员等等。 以下是使用Numpy,Pandas(Series和DataFrame)和Matplotlib进行分析的要点。 问题: 哪种类型的电影发行量最高? 关于投票数2.a。 哪些是前五部电影? 2.b. 谁是前5名演员? 2.c. 谁是前五名董事? 哪部电影3.a. 赚了最高和最少的利润? 3.b. 有最高和最低人气分数吗? 3.c. 收入最高和最低? 3.d. 有最高预算还是最低预算? 4.a. 哪一年的电影上映次数最多? 4.b. 哪一年的年
2021-12-03 09:18:25 3.51MB HTML
1
包含电商销售交易数据,以及python分析数据的源码,分析了整体销售情况、地区分布(饼图)、付款时间分布(折线图)、销售走势图(折线图)。
1
数据分析 目标: 执行探索性数据分析,找出业务问题,确定可提高利润的关键领域
2021-11-19 13:53:54 465KB JupyterNotebook
1
探索性数据分析-奥林匹克历史120年 120年奥运历史的探索性数据分析 在这个项目中,我做了一些探索性分析,以回答某些问题,例如: 随着运动员年龄的增长,他们获得奥运会奖牌的机会减少。 与年长的运动员相比,年轻的运动员赢得了更多的模态。 我将使用Python对此数据集进行EDA回答此问题。 目录 介绍 EDA是我们在初步调查中需要执行的关键过程之一,以便对数据集有很好的了解。 在此过程中,我们借助摘要统计信息和图形表示来发现模式,发现异常,检验假设和检验假设。 在这个项目中,我进行了以下分析: 直方图 散点图,条形图 统计摘要 概率质量函数(PMF) 累积分布函数(CDF) 概率密度函数(PDF) 正态分布 资料背景 这是现代奥运会的历史数据集,包括从1896年雅典到2016年里约热内卢的所有奥运会。请注意,冬季和夏季运动会在同一年举行,直到1992年。之后,他们错开了方向,
2021-11-17 15:16:03 5.31MB JupyterNotebook
1
midasr R软件包提供了处理混合频率数据的计量经济学方法。 该软件包提供了用于估计时间序列MIDAS回归的工具,其中响应和解释变量的频率不同,例如每季度还是每月。 可以对拟合的回归模型进行适当性测试,然后将其用于预测。 更具体地说,可以使用以下主要功能: midas_r使用NLS进行MIDAS回归估计。 midas_nlpr非线性参数MIDAS回归估计。 midas_sp半参数和部分线性MIDAS回归。 midas_qr分位数MIDAS回归。 mls嵌入较低频率的时间序列,用于指定MIDAS模型的灵活功能。 mlsd使用可用的日期信息以较低频率嵌入时间序列。 hAh.test和hAhr.test -MIDAS回归的充分性测试。 forecast -预测MIDAS回归。 midasr_ic_table使用信息标准选择延迟 average_forecast计算加权预测组合
2021-11-16 00:53:54 221KB R
1
水质 使用ggplot2进行水质分类,TS和剖面图,以帮助分析海洋数据。 R软件包版本0.1.0 该软件包包含水质分类,温度盐度和剖面图函数。 这些功能在此软件包中是最新的,最终可能会被CRAN所使用。
2021-11-11 10:33:28 139KB R
1
MNE实时 这是用于使用MNE实时分析MEG / EEG数据的存储库。 该文档可以在这里找到: 依存关系 安装 我们建议使用Anaconda Python发行版。 我们要求您使用Python3。您可以选择通过pip实时安装mne。 除了numpy和scipy (标准的Anaconda安装中包括)之外,您还需要使用pip工具安装最新版本的MNE : $ pip install -U mne 然后安装mne-realtime : $ pip install https://api.github.com/repos/mne-tools/mne-realtime/zipball/master 如果要更新的mne-realtime版本可用,这些pip命令也可以使用。 如果您在计算机上没有管理员特权,请对pip使用--user标志。 快速开始 info = mne . io . read_i
2021-11-10 02:55:10 7.05MB realtime lsl mne-python fieldtrip-buffer
1
自杀率数据分析
2021-11-09 15:28:45 510KB JupyterNotebook
1
a)简介 我们选择了START联盟的全球恐怖主义数据库,第2版[1]。 它包含有关170,000多次恐怖袭击的信息。 “全球恐怖主义数据库(GTD)是一个开放源代码数据库,其中包含有关1970年至2016年全球恐怖袭击的信息(计划在未来进行年度更新)。GTD包括有关国内和国际恐怖主义事件的系统数据,在此期间发生了此类事件,目前包括170,000多个案例。该数据库由总部位于马里兰大学的国家恐怖主义与对策研究联盟(START)的研究人员维护。” [2] 数据集包含有关以下问题的信息: 身份证和日期 事件信息 事故地点 攻击信息 武器情报 目标/受害者信息 犯罪者信息 因果关系和后果: 可以上找到更多信息。 b)数据分析 该数据集包含1970年至2017年期间来自恐怖袭击的135列,但由于数据丢失,不包括1993年。 一些列包含字符串数据或类别编号。 对于其他数据,我们在每个gname
2021-11-02 15:56:13 1009KB Python
1
旅游攻略选择
2021-10-26 22:33:13 138KB 旅游 python 爬虫
1