频率和众数 百分位数 位置度量:均值和中位数 散布度量 多元汇总统计 汇总数据的其他方法 四分位数 分位数根据其将数列等分的形式不同可以分为中位数,四分位数,十分位数、百分位数等等。四分位数作为分位数的一种形式,在统计中有着十分重要的意义和作用。人们经常会将数据划分为4个部分,每一个部分大约包含有1/4即25%的数据项。这种划分的临界点即为四分位数。它们定义如下: Q1=第1四分位数,即第25百分位数; Q2=第2四分位数,即第50百分位数; Q3=第3四分位数,即第75百分位数。 四分位数是将数列等分成四个部分的数,一个数列有三个四分位数,设下四分位数、中位数和上四分位数分别为Q1、Q2、Q3,则:Q1、Q2、Q3的位置可由下述公式确定: 四分位数是将数列等分成四个部分的数,一个数列有三个四分位数,设下四分位数、中位数和上四分位数分别为Q1、Q2、Q3,则:Q1、Q2、Q3的位置可由下述公式确定:
第一讲 概述 第二讲 大数据时代 第三讲 云计算及其影响 第四讲 物联网及其影响 第五讲 数据挖掘方法与技术 第六讲 粗糙集 第七讲 人工神经网络 第八讲 分类数据挖掘 第九讲 关联规则挖掘 第十讲 聚类模式挖掘 第十一讲 web 数据挖掘 第十二讲 数据挖掘工具及应用 数据库(DB)与数据仓库(DW),大数据处理(Big Data)与数据挖掘技术是当代数据处理的最新技术。这几项技术的结合开创了决策支持系统(DSS)发展的新方向。建立DW是科学决策的前提。 课程学习的目标 (1)掌握DB,DW,OLAP,DM与DSS的基本概念,工作原理,系统功能和结构 (2)了解如何建立DW系统、基于DW的决策支持系统、OLAP的多维数据分析. Big Data; (3)掌握数据挖掘和知识发现(DM&KD)基本原理 (4)了解数据挖掘和知识发现(DM&KD)发展方向
2021-08-10 09:10:29 2.58MB 资源达人分享计划 数据挖掘 大数据
聚类分析是将物理的或者抽象的数据集合划分为多个类别的过程,聚类之后每个类别中任意两个数据样本之间具有较高的相似度,而不同类别的数据样本之间具有较低的相似度。
2021-08-07 16:22:04 2.58MB 聚类 机器学习
数据库中的知识发现(Knowledge Discovery in Database,简称KDD)是一个从数据库中挖掘有效的、新颖的、潜在有用的和最终可理解的模式的复杂过程。 1)数据是一组事实的集合,它可以来自不同的数据源,可以是规则数据,也可以是非规则数据。 2)模式是关于数据子集的某种语言描述的表达式或某种可应用的模型,又称为知识。 3)模式必须是有效的、新颖的、潜在有用的和最终可理解的,分别用可信度、新颖度、可用度和简单度对其进行评价
2021-08-07 16:22:03 1.45MB 数据挖掘
基于SQL SERVER的数据仓库架构,Microsoft SQL Server 2012 Integration Services (SSIS) 平台可以生成高性能数据集成解决方案,其中包括为数据仓库提取、转换和加载 (ETL) 包 Microsoft SQL Server提供两种ETL方式: 1、导入和导出数据 2、SQL Server Data Tools
2021-08-07 16:22:02 4.85MB 数据挖掘 数据仓库
数据仓库和数据挖掘技术是基于大规模数据库的决策支持系统环境的核心。
2021-08-07 16:22:01 8.73MB 数据挖掘
人工神经网络(Artificial Neural Network,ANN)是对人类大脑系统特性的一种描述。简单地讲,它是一种数学模型,可以用电子线路来实现,用计算机程序来模拟,是人工智能的一种方法。神经网络通过对大量历史数据的计算来建立分类和预测模型。
2021-08-07 12:06:17 1.51MB 深度学习 神经网路
遗传算法(Genetic Algorithms,GA)是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化搜索算法。它模拟了生物的繁殖、交配和变异现象,从初始的种群,产生一群更适应环境的后代。
2021-08-07 12:06:16 1.76MB 数据挖掘 遗传算法
现实生活中有许多含糊现象并不能简单地用真、假值来表示﹐如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague)一词,他把它归结到边界线上,也就是说在全域上存在一些个体既不能在其某个子集上分类,也不能在该子集的补集上分类。
2021-08-07 12:06:15 1.79MB 数据挖掘 粗糙集
决策树(decision tree)类似于流程图的树结构,由一个根节点,一组内部节点和一组叶节点组成。每个内部节点(包括根节点)表示在一个属性上的测试,每个分枝表示一个测试输出,每个叶节点表示一个类,有时不同的叶节点可以表示相同的类。
2021-08-07 12:06:11 2.24MB 决策树