搜索【数据清洗】的结果

Python数据清洗实战入门

本次课程主要以真实的电商数据为基础，通过Python详细的介绍了数据分析中的数据清洗阶段各种技巧和方法。

2022-12-13 11:09:08 5.12MB 数据 编程语言 Python python 数据分析 电商 class

1

基于Spark的健康监测管理系统的数据清洗与数据分析.zip代码为基于Spark的健康监测管理系统的数据清洗与数据分析部分，数据清洗部分使用RDD，分析部分综合使用sparksql与RDD，最终转为DataFrame进行计算，因网络上可供参考的文献、项目等较少，本项目为从事大数据开发的人员提供参考基于Spark的健康监测管理系统的数据清洗与数据分析.zip代码为基于Spark的健康监测管理系统的数据清洗与数据分析部分，数据清洗部分使用RDD，分析部分综合使用sparksql与RDD，最终转为DataFrame进行计算，因网络上可供参考的文献、项目等较少，本项目为从事大数据开发的人员提供参考基于Spark的健康监测管理系统的数据清洗与数据分析.zip代码为基于Spark的健康监测管理系统的数据清洗与数据分析部分，数据清洗部分使用RDD，分析部分综合使用sparksql与RDD，最终转为DataFrame进行计算，因网络上可供参考的文献、项目等较少，本项目为从事大数据开发的人员提供参考基于Spark的健康监测管理系统的数据清洗与数据分析.zip代码为基于Spark的健康监测管理

2022-12-12 14:24:59 1.27MB 基于Spark的健康监测管理系统 健康监测管理系统的数据清洗 健康监测管理系统的数据分析 大数据

基于Hadoop的全国酒店数据清洗项目源码+报告.zip

基于Hadoop的全国酒店数据清洗项目源码+报告.zip结合本案例背景介绍，说明对本数据集进行分析的目的，说明采用的分析技术，实现的价值。本案采用的数据集是全国各省市酒店的运营情况数据集，对该数据集进行分析的目的是为了更好的指导酒店行业的发展。本案例使用hdfs分布式存储系统存储数据，利用Hadoop的MapReduce技术进行数据分析。 3、简要介绍mapreduce框架 MapReduce是面向大数据并行处理的计算模型、框架和平台，它隐含了以下三层含义：（1）MapReduce是一个基于集群的高性能并行计算平台（Cluster Infrastructure）。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip

2022-12-10 14:23:19 990KB 基于Hadoop全国酒店数据清洗 全国酒店数据清洗项目 Hadoop

RFID数据清洗处理策略与算法

RFID清洗算法描述，策略运用，rfid工作原理。

2022-11-07 16:37:56 1.56MB RFID清洗策略

1

数据清洗实践数据文件压缩包

本压缩包可供个人学习实践使用，严禁除此以外的一切用途！违法必究

2022-10-20 19:05:13 1.79MB etl 数据库 大数据 数据清洗

1

深度学习吸烟数据集(以处理：数据划分，数据增强，数据清洗，负样本添加)

抽烟检测一共2500多张图片含负样本，训练测试比例为8：2。进行了数据划分，数据增强，数据清洗，负样本添加，可以直接下载使用。准确率可达0.98+

2022-09-28 12:05:38 268.82MB 抽烟检测 深度学习 人工智能

1

论文研究-一种基于双聚类的缺失数据填补方法.pdf

针对现实数据集的数据缺失问题，提出了一种基于双聚类的缺失数据填补新方法。该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性，将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题，进而实现了数据集中缺失元素的预测；再利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解，并进行了数学上的分析证明。最后进行仿真验证，通过观察UCI数据集的实验结果可知，提出的算法具有较高的填补准确性。

2022-09-19 11:04:52 1.42MB 缺失数据填补 双聚类 双聚类数据填补 数据清洗

1

数据采集与数据清洗+数据库连接+JMP+EXCEL+数据分析

目录一、数据采集二、原始数据的获取 2.1 使用JMP软件从数据库获取数据 2.2 使用EXCEL从数据库获取数据 2.3 将多个数据文件合并到一个表三、数据清洗 3.1 选择子集 3.2 字段（列名）重命名 3.3 删除重复值 3.4 缺失值处理 3.5 一致化处理 3.6 数据堆叠 3.7 异常值的判断与处理

2022-09-10 19:03:33 11.96MB 数据采集 数据清洗 JMP操作 excel操作

1

对输入数据进行随机划分，并将xml文件转为txt

2022-08-24 21:05:24 11KB 数据清洗

1

大数据的数据清洗技术及运用.pdf

Data Base Technique 数据库技术 Electronic Technology & Software Engineering 电子技术与软件工程 157 【关键词】大数据数据清洗技术数据质量 1 数据清洗技术概述数据清洗技术是为了提高数据质量而剔除数据中错误记录的一种技术手段，在实际应用中通常与数据挖掘技术、数据仓库技术、数据整合技术结合应用。数据清洗技术的基本原理为：在分析数据源特点的基础上，找出数据质量问题原因，确定清洗要求，建立起清洗模型，应用清洗算法、清洗策略和清洗方案对应到数据识别与处理中，最终清洗出满足质量要求的数据。具体如 1 所示。数据清洗是数据分析、数据挖掘的前提，也是数据预处理的关键环节，可保证数据质量和数据分析的准确性。在大数据环境下，数据清洗技术已经被广泛应用于大健康、银行、移动通信、交通等领域，在一定程度上保证了数据质量，为大数据决策提供了可靠依据。 2 大数据的数据清洗技术及应用 2.1 基于函数依赖的数据清洗技术基于函数依赖的数据清洗技术，可解决数据异常、重复、错误、缺失等问题，能够在数据预处理环节对

2022-06-22 09:03:39 1.43MB 文档资料

个人信息

热门下载

最新下载

其他资源