第五章
探索性数据分析,结合了dplyr和ggplot2
1.简介
提出问题→通过可视化,转换和建模来解决问题→优化并提出新问题
2.提出问题
变量自身会发生何种变动?
变量之间会发生何种相关变动?
术语:在tidydata(整洁的数据)中,行是观测,列是变量。
变量:一种可测量的数量、质量或属性。
值:变量在测量时的状态。变量值在每次测量之间可以发生改变。
观测:或称个案,指在相同条件下进行的一组测量(通常,一个观测中的所有测量是在同一时间对同一对象进行的)。一个观测会包含多个值,每个值关联到不同的变量。有时我们会将观测称为数据点。
表格数据:一组值的集合,其中每个值都关联一个变量和一个观测
1