包含电商销售交易数据,以及python分析数据的源码,分析了整体销售情况、地区分布(饼图)、付款时间分布(折线图)、销售走势图(折线图)。
1
python数据分析 数据集,包括源代码,实例源码和数据集
2021-11-20 13:44:39 69.5MB 数据分析 数据集
1
爱学习的人群
2021-11-20 13:05:55 14KB python
1
本资料主要是基于pyhton数据分析与挖掘实战书本中的源代码和数据。代码已测试通过。主要是通过python来进行数据分析和挖掘。通过数据获取,数据预处理及数据规范化,数据建模,及数据可视化。
2021-11-20 09:21:05 325.37MB 数据分析 海量数据挖掘
1
ggplot简介   ggplot是一个Python绘图包,它基于R语言的ggplot2包和图形语法。ggplot与其他绘图包的关键区别是它的语法将数据与实际绘图明确地分离开来。为了对数据进行可视化表示,ggplot提供了几种基本元素:几何对象、图形属性和标度。除此之外,为了进行更高级的绘图,ggplot还提供一些附加元素:统计变换、坐标系、子窗口和可视化主题。   Python的ggplot库不像R语言的ggplot2库那样成熟,所以它不具备ggplot2的所有功能。也就是说,它没有那么多的几何对象、统计变换和标度,也没有坐标系、注释和增强功能。在与ggplot相关的包进行了升级与修改之后,
2021-11-19 20:07:58 549KB pl plot python
1
包含数据分析和数据挖掘的学习代码和实战代码 本项目很多内容属于边学边试。参考了书籍,但是很多代码存在过时和错误均被我修改。 数据挖掘是最近几年才出现的一个名词,其归根到底的目的就是经过一系列手段处理数据得到一个适合的建模数据,利用建模数据建立模型挖掘已有数据的隐含价值。 一般步骤(详细内容子目录有叙述,且后面的实战项目我会严格按照这个步骤进行) 数据获取 利用各种手段获取数据,数据样式不限制,但一般而言是形如excel或者csv这样的表格格式。 数据探索 对数据进行初步探索,得到数据特征(如每一列的平均值,分位数,最大最小值,空值数目)。 数据预处理 毫不夸张,这是整个数据挖掘过程中最费时间的部分。对原始数据进行处理,得到合适的建模数据(如处理异常值,属性规约,数据清洗,数据变换,数据标准化)。 数据挖掘建模 如果任务明确,模型的选择是指定的,但是算法的优化,准确率的考究等是需要处理的。(如分类预测、关联规则获取。 后续处理 一般是指模型的实际应用。
2021-11-19 14:39:24 59.59MB python 数据 数据分析 数据挖掘
1
本项目包含作业要求和源代码,项目基于Python Scrapy爬虫实现对上市公司股民评论的爬取和公司年报的爬取;基于Python Tushare 爬取上市公司行情图,对爬取的内容进行预处理,包括分词、去停用词、转化词袋模型等。最后可视化结果,可视化清晰明了,可作为公司是否存在会计欺诈手段的检测
2021-11-19 12:03:26 34.88MB Scrapy Python预处理大作业 分词、可视化
Python数据分析与机器学习-聚类实践 Python数据分析与机器学习-聚类实践
2021-11-19 11:31:54 3KB python
1
1、pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图等统计图表。 2、柱状图 适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较,用于显示一段时间内的数据变化或显示各项之间的比较情况。 优点: 利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。 缺点: 只适用中小规模的数据集。 柱状图最基本用法 from pyecharts import Bar fruits = ['苹果','香蕉','凤梨','桔子'
2021-11-19 11:12:32 476KB ar art bar
1
前言 做网络爬虫的同学肯定见过各种各样的验证码,比较高级的有滑动、点选等样式,看起来好像挺复杂的,但实际上它们的核心原理还是还是很清晰的,本文章大致说明下这些验证码的原理以及带大家实现一个滑动验证码。 实际上这类验证码的校验是分为两个步骤的: 1.第一步就是前端的校验。一般来说,登录注册页面在点击提交的时候都会伴随着一个表单提交,在表单提交的时候会有 JavaScript 事件的触发。如果加入了验证码,那么在表单提交的时候会多加一个额外的验证,判断这个验证码是否已经成功完成了操作。如果没有的话,那就直接取消表单的提交,然后顺便提示说”您的验证没通过,请重新验证“,诸如此类的话。所以这一步就能防
2021-11-18 16:26:27 138KB python 数据校验 验证码
1