2.3 数据仓库的任务 数据仓库的任务是发布企业的数据资产,用于支持更加有效的决策制定。该 任务描述中的关键词是发布。正如传统的杂志发行,其成功的起点和终点是读者, 数据仓库成功的起点和终点是其最终用户。由于数据仓库是一个决策支持系统, 因此主要的成功标准是数据仓库是否为企业的最重要的决策制定过程提供了帮 助。虽然必须仔细管理硬件、软件、劳动力、咨询服务和维护的成本,但是其隐 含的成本——支持企业重要决策方面的失败——可能会更大。数据仓库的由 IT 管理的可见成本是可能战术上的,但是更为重要的决策支持成本和收益却是战略 上的。 交易数据库在企业中应用已经超过 30 年。虽然十几年来我们一直把各种数 据输入到特定的交易应用系统中,但很清楚的是,从这些系统获取数据来进行分 析是非常困难的。在数据库应用系统上已经花费了数十亿美元的投资,但它们的 数据却像犯人一样被关在系统里面。为了从交易系统中把数据取出来已经花费了 不可估算的时间,但就像在迷宫中游走一样,大部分的努力都以死胡同结束。ETL 系统必须完成这个任务,那就是以可用的方式把数据交给最终用户应用系统。 建设一个无所不包的、可靠的数据仓库是一件很有意义的任务,必须有一系 列的标准组件来支撑。数据仓库最重要且基础的组件就是后台和前台。该书是关 于后台的。 数据仓库是什么 数据仓库是将数据从原有交易系统数据库中提取出来,经过转换后形成有组 织的信息的过程,它帮助进行数据分析,支持决策的制定。此过程包括从原始数
2023-08-06 20:35:36 4.73MB 数据仓库 ETL SSIS
1
图表 1.2 数据仓库的四个集结步骤 本书中间部分的章节会重点介绍这四个步骤,这四个步骤是: 1. 抽取。源系统的原始数据在进行大的转换之前通常直接写入到磁盘。来自 于结构化源系统的数据(比如 IMS 数据库,或者 XML 数据集)在这一步中经常 写入到文本文件或者关系型数据库表中。这使得最初的抽取尽可能简单和快速,
2023-08-06 20:35:05 4.73MB 数据仓库 ETL SSIS
1
图表 1.1 数据仓库的后台和前台 假设有一个餐厅。餐厅的客人是最终用户,提供的食物是数据。提供给餐厅 里客人的食物完全符合客人的要求:干净,组织良好,每一片都能轻易辨认与食 用。但是,在食物进入餐厅之前,是在厨房中由经验丰富的厨师仔细准备。食物 要进行挑选、清洗、切片、烹饪以及摆放。厨房只是工作间,不允许客人访问。 在好的餐厅,厨房是完全与客人隔离的——一旦暴露厨房,那里食物还处于半加 工状态,是会严重影响客人的胃口的。如果客人需要了解食品准备的信息,厨师 必须从厨房出来到餐厅中面对客人,在一个安全、干净、客人觉得比较舒服的环 境中解释食物的准备过程。 集结区就是数据仓库的厨房。它只对经验丰富的数据集成专家开放。这是一 个后台的处理工具,不允许最终用户访问。在这里,从源系统抽取来的数据进行
2023-08-06 20:34:55 4.73MB 数据仓库 ETL SSIS
1
数据仓库建模的有关说明 详细的文档及解读的ppt
2023-06-30 08:56:01 2.17MB 数据仓库
1
为适应日趋激烈的市场竞争环境,提升企业核心竞争力,需要充分利用移动业务支撑系统产生的大量宝贵的数据资源,建立基于数据仓库的移动企业业务经营分析系统。本文以移动业务分析系统为例,有别于普通集中式、三层数据仓库系统应用架构,研究构建企业级分布式、多层次数据仓库系统体系架构和模型设计。主要包括以下内容:1.分布式数据仓库体系架构;2.多层次的系统数据架构;3.数据仓库主题模型设计和多维度分析设计。
2023-06-20 13:19:33 134KB 数据仓库
1
数据仓库 知识发现 数据挖掘 韩家炜 第三版 epub 高清晰格式 (内容齐全)
2023-06-19 07:56:06 7.02MB 数据仓库 知识发现 数据挖掘
1
数据仓库与数据挖掘(廖开际) 不错的资料
2023-06-19 07:43:21 7.99MB (廖开际)数据仓库与数据挖掘
1
数据仓库(W.H.Inmon等著,译版),介绍数据仓库的模型、设计、实际开发实现
2023-06-17 21:41:04 6.66MB 数据仓库 元数据 数据仓库模型设计
1
Iceberg构建湖仓一体架构的必备,与Delta Lake、hudi齐名,数据湖技术三驾马车。
2023-05-28 22:43:50 1.6MB deltalake 数据仓库 数据湖 湖仓一体
1
模型设计的三个阶段 1. 概念模型:划分主题 2. 逻辑模型:即一个主题可以分析归纳出的某几种具体生活常识中的总结点,例如自然人的 动产 不动产等。 3. 物理模型:物理模型设计是指根据逻辑模型设计的结构为基础,设计数据对象的物理实现,比如表的命名规范、字段的命名规范、字段类型选择、分区设置、存储设置、更新方式、调度配置(调度时间、父子节点等)
1