巧克力条评级数据集的探索性数据分析
s
柏林阿西杜
芭芭拉·阿萨玛
本尼迪克·纳蒂
别林达·奥塞图图
介绍
探索性数据分析(EDA)是数据科学项目中最关键的步骤之一。 EDA的基本术语是“借助可视化和描述性统计数据了解数据”的一种方式。 巧克力是可可可粉经过烘焙和磨碎的制剂,以液体,糊状或块状形式制成,也可以在其他食品中用作调味成分。 巧克力是全世界儿童和成人喜爱的糖果。 巧克力基本上是由可可和其他一些添加剂制成的。 这些数据的探索将基于数据分析周期:了解数据,提出问题,提出假设,数据清理,数据分析,发现和建议。 该报告详细说明了分析Chocolate Bar Ratings数据集所使用的步骤和过程。 这是对来自世界各地的1795块巧克力条的分析。 从数据中,我们将查看巧克力棒的各种制造地点,可可豆的原产国和总体评级以及其他各种其他信息。 数据来自曼哈顿巧克力协会的布雷迪·布雷林斯基。
1