数据挖掘案例解析 一、本次数据分析,通过提供的数据,分析出月均销售额、月均销售次数、客单价、报销金额 1、 读取'xx医院2019年销售数据.xlsx',将前5行数据打印输出,确保数据正确。 二、数据清洗 1、 将”购药时间”修改成”销售时间” 2、 缺失数据处理 3、 数据类型转换,将销售数量、应收金额、实收金额的数据类型改为数值类型(float)。 4、 修改日期,把日期里面的星期去掉,只留下日期 5、 将表格里读取的日期字符串转换日期格式 6、 按销售日期进行升序排列数据排序 7、 统计销售数量、应收金额、实收金额的最大值与最小值 三、分析数据 第一个指标:月均销售次数=总销售次数/月数 1、 同一个人发生的所有消费算作一次消费,根据列名(销售时间,社区卡号),如果这两个列值同时相同则算作为一次消费。 2、 计算月份数最早一笔消费的时间和最晚一笔消费的时间之间的时间间距得出月份。 第二个指标:月均销售金额=总销售金额/月份数 1、 总销售金额等于实收金额的和。 第三个指标:客单价=平均交易金额=总消费金额/总消费次数 第四个指标:报销金额 = 应收金额总和-实收金额总和 四、按月统计销售情况,使用折线展示
2021-11-12 17:00:43 4KB py
1
利用python可以获得气温和降水月数据来计算气温和降水数据的逐年平均值,从而简化数据处理过程,最终获得某一时间段内气温和降水的均值。
2021-11-12 00:42:26 673B python tif 均值
1
boruta_py 该项目托管了Python实现。 如何安装 用pip安装: pip install Boruta 或使用conda : conda install -c conda-forge boruta_py 依存关系 麻木 科学的 scikit学习 如何使用 下载,导入并使用其他任何scikit-learn方法进行操作: 适合(X,y) 变换(X) fit_transform(X,y) 描述 Boruta R包的Python实现。 此实现尝试模仿scikit-learn接口,因此请使用fit,transform或fit_transform来运行功能选择。 有关更多信息,请参见这些功能的文档以及下面的示例。 原始代码和方法,作者:Miron B. Kursa, ://notabug.org/mbq/Boruta/wiki/FAQ Boruta是所有相关的特征选择方
2021-11-11 11:04:27 61KB Python
1
用梯度法实现的求解线性方程组程序。 程序较为清晰,可以调用求解一般的线性方程组。
2021-11-11 09:25:32 2KB python 梯度法
1
用xml文件生成json文件,用于训练coco数据格式的检测网络,
2021-11-10 21:42:24 10KB coco xml json
1
一个井字棋小游戏可双人.py
2021-11-10 20:42:58 7KB python
1
使用python将动图转换为视频.
2021-11-10 18:07:22 4KB python moviepy 动图
同时计算两幅图片的PSNR(峰值信噪比)及SSIM(结构相似性)及MSE(均方差),通过设置不同图片所在的文件夹位置来进行操作。将最终结果展示到终端界面。
2021-11-10 17:07:44 2KB PSNR SSIM MSE 图像处理
1
使用IDEL运行,打开后讲文件路径替换掉,同时可以设置分辨率,适用于制作现状、规划、总规、影像等图件
2021-11-09 19:37:22 543B GIS批量导出JPG 批量出图
1
学校需要天天进校备案
2021-11-09 18:12:13 1KB 自动签到 python 备案
1