这个是利用Python进行数据分析与挖掘实战第15章的stoplist数据,我在网上找了好久找不到,希望对大家有帮助,解压即可
2021-11-22 23:41:14 4KB python 数据分析 数据挖掘
1
博客 二十七、Kaggle| 研究生入学率预测 代码和数据 可以用于大学的作业: 自选一个分类或者回归任务的外部数据集,利用数据完成如下操作:1、说明数据的来源、介绍数据集的特征及标签2、数据的预处理(缺失值、异常值及其他变量处理等)3、对数据集进行描述性统计分析4、从已学的分类或者回归算法中,选择多种算法实现回归任务,并说明哪种算法效果最好。
2021-11-22 12:03:19 130KB python
本课程是Python数据分析实战课程,从数据搜集、数据存取、数据清洗、数据分析、数据可视化一步一步完成北京二手房价数据分析过程。
1
企业所得税的影响因素分析及预测模型实验报告
2021-11-20 16:03:07 1.17MB python 数据挖掘
包含电商销售交易数据,以及python分析数据的源码,分析了整体销售情况、地区分布(饼图)、付款时间分布(折线图)、销售走势图(折线图)。
1
python数据分析 数据集,包括源代码,实例源码和数据集
2021-11-20 13:44:39 69.5MB 数据分析 数据集
1
爱学习的人群
2021-11-20 13:05:55 14KB python
1
本资料主要是基于pyhton数据分析与挖掘实战书本中的源代码和数据。代码已测试通过。主要是通过python来进行数据分析和挖掘。通过数据获取,数据预处理及数据规范化,数据建模,及数据可视化。
2021-11-20 09:21:05 325.37MB 数据分析 海量数据挖掘
1
ggplot简介   ggplot是一个Python绘图包,它基于R语言的ggplot2包和图形语法。ggplot与其他绘图包的关键区别是它的语法将数据与实际绘图明确地分离开来。为了对数据进行可视化表示,ggplot提供了几种基本元素:几何对象、图形属性和标度。除此之外,为了进行更高级的绘图,ggplot还提供一些附加元素:统计变换、坐标系、子窗口和可视化主题。   Python的ggplot库不像R语言的ggplot2库那样成熟,所以它不具备ggplot2的所有功能。也就是说,它没有那么多的几何对象、统计变换和标度,也没有坐标系、注释和增强功能。在与ggplot相关的包进行了升级与修改之后,
2021-11-19 20:07:58 549KB pl plot python
1
包含数据分析和数据挖掘的学习代码和实战代码 本项目很多内容属于边学边试。参考了书籍,但是很多代码存在过时和错误均被我修改。 数据挖掘是最近几年才出现的一个名词,其归根到底的目的就是经过一系列手段处理数据得到一个适合的建模数据,利用建模数据建立模型挖掘已有数据的隐含价值。 一般步骤(详细内容子目录有叙述,且后面的实战项目我会严格按照这个步骤进行) 数据获取 利用各种手段获取数据,数据样式不限制,但一般而言是形如excel或者csv这样的表格格式。 数据探索 对数据进行初步探索,得到数据特征(如每一列的平均值,分位数,最大最小值,空值数目)。 数据预处理 毫不夸张,这是整个数据挖掘过程中最费时间的部分。对原始数据进行处理,得到合适的建模数据(如处理异常值,属性规约,数据清洗,数据变换,数据标准化)。 数据挖掘建模 如果任务明确,模型的选择是指定的,但是算法的优化,准确率的考究等是需要处理的。(如分类预测、关联规则获取。 后续处理 一般是指模型的实际应用。
2021-11-19 14:39:24 59.59MB python 数据 数据分析 数据挖掘
1