1. 什么是数据准备区?在数据准备区中允许使用的数据结构有哪些?各有什么优缺点?
2. 简述异构数据源中的数据抽取技术。
3. 数据质量检查的四大类是什么?为每类提供一种实现技术。
4. 简述数据仓库中的表的基本类型,以及为了保证引用完整性该以什么样的顺序对它们进行加载。
5. 在 ETL过程中四个基本的过程分别是什么?
6. 从 ERP源系统中抽取数据最好的方法是什么?
7. 简述直接连接数据库和使用 ,ODBC连接数据库进行通讯的优缺点。
8. 什么是代理键?简述代理键替换管道如何工作。
9. 什么叫缓慢维度变化?请分别阐述三大类维度处理方式。
10. 如何实现增量抽取,分别阐述各种增量抽取方式,并且比较各种方式的优劣,及你推荐的做法?
11. 用过什么 ETL工具,以及该工具简单讲述特点。
12. ETL 工具一般有哪些组成部分,其中数据流中常用的控件有?
13. 简述你在以前项目中的 ETL架构思想。
1