目录Python主要数据预处理函数1、interpolate2、unique3、isnull / notnull4、andom5、PCA Python主要数据预处理函数 在数据挖掘中,海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成、转换、规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。 ​
2021-06-27 22:27:22 116KB python python函数 python数据挖掘
1
三年我才想明白,最能影响机器学习算法效果的是特征工程.pdf
1
牛顿环实验通过测定各个级次干涉条纹的位置读数可以实现对透镜曲率半径的测量。该实验测量数据量较多,因此容易出现人为误差,进而影响透镜曲率半径的计算结果。文章将Matlab应用于该实验,开发实验数据预处理程序,可以快速判断实验数据的准确性,实现数据快速查错功能。
2021-06-22 16:03:38 1.54MB Matlab 牛顿环 数据预处理
R语言的有关数据处理,归纳并整合了在R语言中用于计算的语句,是学习R语言的基础时不可或缺的文档
2021-06-21 10:25:29 65KB R R语言 数据
1
拉依达方法、肖维勒方法、一阶差分法,1. 111 基于统计的异常点检测算法 2. 112 基于距离的异常点检测算法 3. 113 基于密度的异常点检测算法 4. 114 基于深度的异常点检测算法 5. 115 基于偏移的异常点检测算法 6. 116 高维数据的异常点检测算法 7. 121 时间序列相关背景 8. 122 基于离散傅立叶变换的时间序列相似性查找
2021-06-21 10:08:02 363KB 数据处理 异常剔除 数据预处理
1
这是一个适合学习数据预处理的资料,其中涉及知识面很广,几乎涉及了所有的数据预处理知识,还有扩展案例
2021-06-06 20:43:43 34.44MB 数据分析 数据预处理
1
本书主要是对机器学习算法所用数据进行预处理所涉及的各项任务
2021-06-03 18:09:51 4.75MB matlab 机器学习 数据处理
ADNI_rs-fMRI数据预处理过程_matlab.docx
2021-05-25 12:01:46 7.2MB ADNI RS-FMRI MCI
1
基于Python和Selenium的BOSS直聘Python岗位数据分析-数据预处理后用于分析的数据
2021-05-23 20:01:36 379KB python
1
特征工程-数据预处理思维导图:从获取数据、数据探索、数据预处理与清洗三个大方面。这个是自己归纳的一个,有什么不对的,欢迎指出来
2021-05-23 19:30:02 122KB 特征工程 数据预处理
1