链家二手房100页数据
2021-06-27 15:01:32 586KB 链家 python 数据分析 爬虫
1
找了好久的中文版没找到,看英文版又有压力,幸亏有某些好心人扫描了,故和大家分享一下。
2021-06-27 11:33:49 78.41MB python 数据分析
1
文章目录1、数据分析的基本流程2、明确需求和目的2.1 需求和目的3、数据收集4、数据预处理4.1 数据整合4.1.1 加载相关库和数据集4.1.2 数据总体概览4.2 数据清洗4.2.1 缺失值的处理4.2.2 异常值的处理4.2.3 重复值的处理5、数据分析5.1 描述性统计分析(1)哪些城市的空气质量较好/较差?(2)对城市的空气质量按照等级划分,每个等级城市数量分布情况如何?(3)空气质量在地里位置分布上,是否具有一定的规律性?5.2 推断统计分析(1)临海城市的空气质量是否有别于内陆城市?(2)全国城市空气质量普遍处于何种水平?5.3 相关系数分析(1)空气质量主要受哪些因素影响?6
2021-06-25 19:56:33 309KB python python数据分析 实战
1
python数据分析的视频和源码 主要内容为Pandas的一系列操作
1
自己编写的python小工具,可以实现txt文件跟Excel文件的相互转换,这个是Windows版本,另有unix版本需要另行下载
2021-06-24 13:01:07 6.35MB 运维开发
1
python数据处理基础
2021-06-24 12:15:08 11.44MB python
1
数据分析,Logit模型,信用卡预测分析,python数据分析。
1
数据分析师不只是统计报表,更是要通过数据发现问题、解决问题,所以不仅要会分析数据,还要挖掘内部规律!
1
数据来自墨西哥的国家,秘鲁和哥伦比亚,年龄在14至61和不同的饮食习惯和身体状况,有17属性和信息处理2111条记录。与饮食习惯相关的属性有:频繁摄入高热量食物(FAVC)、蔬菜摄入频率(FCVC)、主餐次数(NCP)、餐间食物摄入(CAEC)、每日用水量(CH20)、饮酒量(CALC)。与身体状况相关的属性为:卡路里消耗监测(SCC)、体育活动频率(FAF)、使用科技设备时间(TUE)、使用交通工具(MTRANS),获得的其他变量为:性别、年龄、身高和体重。标签变量为NObesity,其值为:不足体重、正常体重、超重I级、超重II级、肥胖I级、肥胖II级和肥胖III级。 该数据集为UCL开源数据集,无需授权即可使用。 主要适用Pandas库进行数据分析,是使用Python进行大数据分析入门的很好示例教材。
2021-06-21 14:02:15 1.07MB Pandas Python 大数据分析 数据可视化
参考测试网站: http://www.pythonscraping.com/pages/warandpeace.html 每个网站都有层叠样式表(Cascading Style Sheet:CSS) CSS让HTML元素呈现出差异化,是那些具有完全相同修饰的元素呈现出不同的样式。比如,有一些标签如下: 还有一些是这样: 我们显然可以根据class属性的值进行爬取
2021-06-21 09:06:10 1.03MB Python 数据采集 网络爬虫 web挖掘