大数据知识点梳理.doc

上传者: 43934844 | 上传时间: 2022-06-22 09:03:33 | 文件大小: 320KB | 文件类型: DOC
第一章引论 什么是数据挖掘? 数据挖掘更正确的命名为"从数据中挖掘知识",是数据中的知识发现(KDD)的同义 词。数据挖掘是从大量数据中挖掘有趣模式和知识的过程,数据源包括数据库、数据仓 库、web、其他信息存储库或动态的流入系统的数据。 知识发现的过程是什么? 知识发现的过程为: (1)数据清理(消除噪声和删除不一致的数据) (2)数据集成(多种数据源可以组合在一起) (3)数据选择(从数据库中提取与分析任务相关的数据) (4)数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式) (5)数据挖掘(基本步骤,使用智能方法提取数据模式) (6)模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) (7)知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识) 3、什么类型的数据可以挖掘? 数据挖掘可以作用于任何类型的数据,数据的最基本形式是数据库数据、数据仓库数 据、事务数据。也可以用于数据流、有序/序列数据、图或网络数据、空间数据、文本数 据、多媒体数据和万维网。 数据库数据 由一组内部相关的数据和一组管理和存储数据的软件程序组成。关系数据库是表的汇 集,每个表被

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明