2.3 数据仓库的任务
数据仓库的任务是发布企业的数据资产,用于支持更加有效的决策制定。该
任务描述中的关键词是发布。正如传统的杂志发行,其成功的起点和终点是读者,
数据仓库成功的起点和终点是其最终用户。由于数据仓库是一个决策支持系统,
因此主要的成功标准是数据仓库是否为企业的最重要的决策制定过程提供了帮
助。虽然必须仔细管理硬件、软件、劳动力、咨询服务和维护的成本,但是其隐
含的成本——支持企业重要决策方面的失败——可能会更大。数据仓库的由 IT
管理的可见成本是可能战术上的,但是更为重要的决策支持成本和收益却是战略
上的。
交易数据库在企业中应用已经超过 30 年。虽然十几年来我们一直把各种数
据输入到特定的交易应用系统中,但很清楚的是,从这些系统获取数据来进行分
析是非常困难的。在数据库应用系统上已经花费了数十亿美元的投资,但它们的
数据却像犯人一样被关在系统里面。为了从交易系统中把数据取出来已经花费了
不可估算的时间,但就像在迷宫中游走一样,大部分的努力都以死胡同结束。ETL
系统必须完成这个任务,那就是以可用的方式把数据交给最终用户应用系统。
建设一个无所不包的、可靠的数据仓库是一件很有意义的任务,必须有一系
列的标准组件来支撑。数据仓库最重要且基础的组件就是后台和前台。该书是关
于后台的。
数据仓库是什么
数据仓库是将数据从原有交易系统数据库中提取出来,经过转换后形成有组
织的信息的过程,它帮助进行数据分析,支持决策的制定。此过程包括从原始数
1