纠缠并分析数据
介绍
现实世界中的数据很少是干净的。 使用Python及其库,您将以各种格式从各种来源收集数据,评估其质量和整洁度,然后对其进行清理。 这称为数据整理。 您将在Jupyter Notebook中记录您的艰苦努力,并通过使用Python(及其库)和/或SQL进行分析和可视化来展示它们。
您将要处理(以及分析和可视化)的数据集是Twitter用户@dog_rates的推文存档,也称为WeRateDogs。 WeRateDogs是一个Twitter帐户,通过对狗的幽默评论为人们的狗评分。 这些评级的分母几乎总是10。但是,分子是多少? 几乎总是大于10。11/ 10、12 / 10、13 / 10等。为什么? 因为“他们是布伦特的好狗”。 WeRateDogs拥有超过400万的追随者,并已获得国际媒体的报道。
WeRateDogs下载了他们的Twitter存档,并通过电子邮件
1