一、数据预处理与导入
1、2019_nCoV_data.csv是2020年1月-3月世界新冠疫情的数据,要求对2019_nCoV_data.csv进行数据预处理做以下操作,要求:
(1)Sno编号列没有用,需要删除
部分国家对应的地区为NAN,需要填充为空白字符串
(3)部分国家/地区,受感染人数为0,也被列在表格中,需要删去
(4)查看受影响的国家/地区的数量,Country一列中将'Mainland China', 'Hong Kong' , 'Macau', 'Taiwan' 等统一修正为'China';另外需将'Korea, South'改为'South Korea'。
2、对于DXYArea.csv也需要进行数据预处理,要求做以下操作:
(2)countryEnglishName一列中将 'HongKong' , 'Macao'等统一修正为'China'。
(3)将updateTime转换成date格式(输出为该数据的新列updateTime1,也就是只保留日期部分)。
(4)因为大部分城市都没有加“市”字,所以要把直辖市的下属区的“区”字去掉;还有一些没有变化规律的城市名
2022-12-16 21:50:44
944KB
可视化大屏