这篇文章找来了有关药品销售数据进行案例分析练习,利用适当的统计方法对相关数据进行月均消费次数、月均消费金额、客单价和消费趋势等几个业务指标进行分析。分析过程为:数据获取、数据清洗、建模分析、可视化(文末有数据获取方式)这是我们的原始数据,xlsx格式导入相关的包并读取数据,读取的时候用object读取,防止有些数据读取不了。接着可以查看数据的相关信息从上图中我们可以看到该数据集一共有6578行数据,其中第一行是标题,有7列。“购药时间”和“社保卡号”有6576条数据,而其余的有6577条,说明数据中存在这缺失值。“购药时间”和“社保卡号”各缺失一行数据,在这里我们要对数据进行缺失值等进一步处理
2021-12-31 10:10:46 331KB 药品销售数据分析
1
数据文件以及jupyter源文件
2021-12-05 22:02:01 425KB 数据分析
1
药品销售数据分析 本案的分析目标是从销售数据中分析出以下业务指标: 1)月均消费次数 2)月均消费金额 3)客单价 4)消费趋势 1、导入数据 2、查看数据基本状况 3.数据清洗 数据清洗步骤: 1.选择子集 2.列名重命名 3.缺失数据处理 4.数据类型转换 5.数据排序 6.异常值处理 缺失数据处理 对于缺失数据,如果缺失数据较少时我们可以直接删除数据。如果缺失数据较多,可以通过建立模型插值来填充数据。 数据类型转换 把数量、金额项目从字符串类型转换为浮点型类型日期项目从字符串类型转换为日期类型 销售日期中含有日期和星期,这里只需用到日期,此需要对数据分割。 查看是否有空值
2021-07-02 19:12:50 422KB 大数据
1