第6章 平面图形的认识(一)【过关检测02】-2020-2021学年七年级数学上册单元复习一遍过(苏科版)(原卷版).docx
2021-08-08 14:03:41 110KB 教育
第6章 平面图形的认识(一)【真题训练】-2020-2021学年七年级数学上册单元复习一遍过(苏科版)(解析版).docx
2021-08-08 14:03:41 234KB 教育
第6章 平面图形的认识(一)【真题训练】-2020-2021学年七年级数学上册单元复习一遍过(苏科版)(原卷版).docx
2021-08-08 14:03:40 193KB 教育
根据观测、调查收集到初步的样本数据集后,接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?有没有出现从未设想过的数据状态?其中有没有什么明显的规律和趋势?各因素之间有什么样的关联性? 通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。数据探索有助于选择合适的数据预处理和建模方法,甚至可以完成一些通常由数据挖掘解决的问题。 本章从数据质量分析和数据特征分析两个角度对数据进行探索。 6.1 数据质量分析 数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础,没有可信的数据,数据挖掘构建的模型将是空中楼阁。 数据质量分析的主要任务是检查原始数据中是否存在脏数据,脏数据一般是指不符合要求,以及不能直接进行相应分析的数据。在常见的数据挖掘工作中,脏数据包括:  缺失值  异常值  不一致的值  重复数据及含有特殊符号(如#、¥、*)的数据 本小节将主要对数据中的缺失值、异常值和一致性进行分析。 6.1.1缺失值分析 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成分析结果的不准确,以下从缺失值产生的原因及影响等方面展开分析。 (1) 缺失值产生的原因 1) 有些信息暂时无法获取,或者获取信息的代价太大。 2) 有些信息是被遗漏的。可能是因为输入时认为不重要、忘记填写或对数据理解错误等一些人为因素而遗漏,也可能是由于数据采集设备的故障、存储介质的故障、传输媒体的
2021-08-08 13:07:23 657KB 数据挖掘 数据分析 RapidMiner 数据探索
据统计,全国每年因窃电造成的损失都在200亿元左右;被查获的窃电案件不足总窃电案件的30%。如深圳龙岗工业区一家只有两条生产线的小塑料包装厂,一年窃电折价就30-40万元之多,某市窃电行为造成电力设施重大破坏,从而引发的大面积停电事故每年都发生多起。这不仅给国有资产造成巨大的损失,也严重扰乱了供电秩序,威胁到电网安全运行。 如何通过监测数据自动识别偷凭电行为? 基于指标加权的用电异常分析模型,虽然能获得用电异常的某些信息 ,但由于终端误报或漏报过多,无法达到真正快速精确定位窃漏电嫌 疑用户的目的,往往令稽查工作人员无所适从。而且在采用这种方法 建模时,模型各输入指标权重的确定需要用专家的知识和经验,具有 很大的主观性,存在明显的缺陷,所以实施效果往往不尽如人意。
2021-08-07 18:11:56 3.38MB 数据挖掘 数据分析 数据模型 窃电分析
Java教学课件PPT
2021-08-06 22:18:46 662KB Java教学课件PPT
非线性振动院士课件
2021-07-25 15:01:38 654KB 动力学
1