python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二(2) 实训练习:练习使用pandas 包中的dataframe和方法。 1将数据读取为dataframe类型,命名为df 2查看数据的形状[了解数据有多少行、多少列] 3查看数据的最开始的7条数据和尾部的3条数据 4查看数据的各字段的类型 5查看数据是否有缺失值 6如果有缺失值,进行补0操作 7从df中按字段取出‘ date’’dist’和‘ flight’形成新的df1 8从df中按位置选取行为3和4,列为0,1的数据形成新的df2 9在df中添加一列‘ low_dest’,内容是‘ dest’这列的字符串的小写形式 10从df中选取‘ dist’大于1000并且小于1200的数据作为一个新的df3 11从df中选取‘ time’大于100的数据做为新的df4 12将df3和df4合并为一个dataframe,命名为df5 13取出df3中的‘ time’,‘dist’ 这两列做为df6, 求出df6中每列中最大值与最小值的差值(运用lambda函数的方式进行求解 ) 14将df根据“ dest”分组,统计各目的地,都有多少条数据,命名为“ dest_count”,然后将“ dest”和“ dest_count”组成新的dataframe命名为df7 15根据dep_delay不为0,统计df中有多少次航班起飞延误 16利用plane字段,统计df中不同航班的飞行次数,以plane和plane_cout格式保存为df8 17利用carrier字段,计算df中carrier字段不同属性数据的数据量的比值(如:XE的数据量与MQ的数据量的比值) 18分别将df7和 df8保存到本地文件,文件名分别为df7.csv和df8.csv
1
大数据和数据挖掘技术在智慧环境监测中的应用研究.pdf
2021-07-04 17:03:04 1.23MB 大数据 数据分析 数据应用 数据时代
漫谈大数据和数据挖掘.pdf
2021-06-17 18:00:05 2.42MB 大数据 数据挖掘
1
聚类算法1
2021-06-15 19:01:35 4KB matlab
1
大数据与数据挖掘
2021-06-15 19:01:35 825B 大数据与数据挖掘
1
大数据与数据挖掘
2021-06-15 19:01:34 491B 大数据与数据挖掘
1
大数据与数据挖掘
2021-06-15 19:01:34 102B 大数据与数据挖掘
1
本文主要整理了大数据的一些基础的知识,对大数据挖掘方面的认识,以及未来大数据发展方向和数据挖掘发展方向的一些预测
2021-06-13 16:35:16 88KB 大数据挖掘 数据挖掘 大数据
1
1、信息收集 2、数据预处理 3、数据挖掘 4、评估 5、知识表示
2021-06-06 19:05:46 2.96MB 大数据 数据挖掘
这个是IBM SPSS Modeler 18 的官方操作手册,包含软件界面、相关控件和相关算法的操作说明,可以通过这个软件进行数据挖掘分析等建模
2021-05-18 18:08:47 30.43MB 大数据 SPSS 数据挖掘
1