探索性数据分析-奥林匹克历史120年 120年奥运历史的探索性数据分析 在这个项目中,我做了一些探索性分析,以回答某些问题,例如: 随着运动员年龄的增长,他们获得奥运会奖牌的机会减少。 与年长的运动员相比,年轻的运动员赢得了更多的模态。 我将使用Python对此数据集进行EDA回答此问题。 目录 介绍 EDA是我们在初步调查中需要执行的关键过程之一,以便对数据集有很好的了解。 在此过程中,我们借助摘要统计信息和图形表示来发现模式,发现异常,检验假设和检验假设。 在这个项目中,我进行了以下分析: 直方图 散点图,条形图 统计摘要 概率质量函数(PMF) 累积分布函数(CDF) 概率密度函数(PDF) 正态分布 资料背景 这是现代奥运会的历史数据集,包括从1896年雅典到2016年里约热内卢的所有奥运会。请注意,冬季和夏季运动会在同一年举行,直到1992年。之后,他们错开了方向,
2021-11-17 15:16:03 5.31MB JupyterNotebook
1
探索性数据分析 我对该项目的目标是,通过从探索性数据分析中收集见识,尝试在kaggle竞赛中取得高分。 我尝试了几种机器学习算法,其中Lasso回归在前2%的最终得分中表现最好。 jupyter笔记本记录了我针对此问题采取的步骤。
2021-11-04 22:33:27 641KB JupyterNotebook
1
影响红葡萄酒品质的化学成分探索 本报告探讨的数据集包含1,599 种红酒,以及 11个关于酒的化学成分的变量。至少3名葡萄酒专家对每 种酒的品质进行了评分,分数在 0(非常差)和10(非常好)之间。 红葡萄酒数据集包含1599种葡萄酒信息,我从理解数据集中的各个变量开始,对各个变量进行观察,探索红葡萄酒中的化学成分对红葡萄酒品质的影响,酒精和红葡萄酒品质有较强的正相关关系,挥发性酸度和红葡萄酒品质有较强的负相关关系,酒精越高,挥发性酸度越低,红葡萄酒品质越好。酒精和硫酸盐与红葡萄酒品质是正相关关系,酒精越高,硫酸盐越高,红葡萄酒品质越好。柠檬酸单独对红葡萄酒的品质几乎没有影响,但是较高的柠檬酸和较高的酒精会对红葡萄酒的品质产生积极影响。
2021-10-14 12:04:47 1.82MB 红葡萄酒数据集 R语言
探索性数据分析,ISBN:9787503723476,作者:(美)DavidC.Hoaglin,(美)FrederickMosteller,(美)JohnW.Tukey著;陈忠琏,郭德媛译
2021-09-26 22:24:35 12.6MB 数据分析
1
In statistics, exploratory data analysis (EDA) is an approach to analyzing data sets to summarize their main characteristics, often with visual methods. A statistical model can be used or not, but primarily EDA is for seeing what the data can tell us beyond the formal modeling or hypothesis testing task.
2021-09-04 14:40:15 2.77MB 统计学 数据分析
1
黑色星期五销售 黑色星期五销售数据集的探索性数据分析。 该项目分析了一个黑色星期五购物的小数据集,其中包含来自客户的人口统计数据。 在这里,我将采用统计和机器学习技术以及数据可视化来探索数据集。 给出的功能无法单手预测客户的购买行为,这就是该项目仅专注于探索性数据分析的原因。 数据已从数据科学网站Analytics Vidhya获得。 可以在“ BFS_functions_and_classes.py”中找到所使用的所有自定义函数和类的代码和文档。
1
world-cup-2018:2018年世界杯的探索性数据分析和数据可视化项目
1
需要的题量多的话建议购买付费专栏(包含上百道题目答案,并持续更新中),性价比更高。
探索性数据分析源代码及测试数据
基于北京二手房价数据的探索性数据分析和房价评估——项目代码 基于北京二手房价数据的探索性数据分析和房价评估——项目代码
2021-04-23 16:51:46 1.24MB 机器学习
1