Cowritten by Ralph Kimball the world"s leading data warehousing authority whose previous books have sold more than 150 000 copies Delivers real world solutions for the most time and labor intensive portion of data warehousing data staging or the extract transform load ETL process Delineates best practices for extracting data from scattered sources removing redundant and inaccurate data transforming the remaining data into correctly formatted data structures and then loading the end product into the data warehouse Offers proven time saving ETL techniques comprehensive guidance on building dimensional structures and crucial advice on ensuring data">Cowritten by Ralph Kimball the world"s leading data warehousing authority whose previous books have sold more than 150 000 copies Delivers real world solutions for the most time and labor intensive portion of data warehousing data staging or the extract transform load ETL process Deline [更多]
本书系统地介绍了数据仓库和数据挖掘技术,全本由两部分组成,第1章到第3章介绍数据仓库的基本概念和相关技术,第4章到第11章介绍数据挖掘的基本概念和各种算法,包括数据仓库构建、OLAP技术、分类方法、聚类方法、关联分析、序列模式挖掘方法、回归和时序分析、粗糙集理论、文本挖掘、Web挖掘和空间数据挖掘方法等。 [1] 本书既注重原理,又注重实践,配有大量图表、示例和练习题,内容丰富,概念讲解清楚,表达严谨,逻辑性强,语言精练,可读性好。 本书既便于教师课堂讲授,又便于自学者阅读。适合作为高等院校高年级学生和研究生“数据仓库和数据挖掘”或“数据挖掘算法”课程的教材。
【完整课程列表】 数据仓库原理 数据仓库设计与应用 第2章 数据仓库开发模型(共30页).ppt 数据仓库原理 数据仓库设计与应用 第3章 数据仓库开发应用过程(共48页).ppt 数据仓库原理 数据仓库设计与应用 第4章 OLAP技术 联机分析处理技术(共29页).ppt 数据仓库原理 数据仓库设计与应用 第5章 传统数据挖掘技术(共35页).ppt 数据仓库原理 数据仓库设计与应用 第6章 现代数据挖掘技术与发展(共41页).ppt 数据仓库原理 数据仓库设计与应用 第7章 数据仓库应用与管理(共32页).ppt
什么是数据仓库 多维数据模型 数据仓库的体系结构 数据仓库实现 从数据仓库到数据挖掘
版本2.1.0 apache-atlas-2.1.0-server.tar.gz和apache-atlas-2.1.0-hive-hook.tar.gz
14.1 概述 14.2 Hive系统架构 14.3 Hive工作原理 14.4 Hive HA基本原理 14.5 Impala 14.6 Hive编程实践
