本书论述在设计和建造数据仓库中涉及的所有主要问题,论述分析型环境(决策支持系统环境)以及在这种环境中的数据构造。主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。 本书主要是面向数据仓库的设计、开发和管理人员,以及构造和使用现代信息系统的人员,也适于信息处理方面的高校师生和从事传统数据库系统技术工作的人阅读。
2021-04-07 20:29:54 10.19MB 数据仓库 data
1
数据仓库实践
2021-04-07 14:03:49 5.99MB MaxCompute 大数据 数据仓库
1
xx行业大数据平台架构设计蓝图:包含行业介绍,成功案例,行业总览,以及AS-IS分析,大数据平台功能架构图,技术架构图,技术演进路线等内容。
2021-04-02 19:02:30 339KB 大数据 hadoop BI 数据仓库
1
模拟电商仓库货物分拣小程序,暴力粗糙还可能有bug
2021-04-01 22:04:11 14KB java 电子商务 数据仓库
1
Clickhouse是一个用于联机分析处理(OLAP)的列式数据库管理系统(columnar DBMS)。 传统数据库在数据大小比较小,索引大小适合内存,数据缓存命中率足够高的情形下能正常提供服务。但残酷的是,这种理想情形最终会随着业务的增长走到尽头,查询会变得越来越慢。你可能通过增加更多的内存,订购更快的磁盘等等来解决问题(纵向扩展),但这只是拖延解决本质问题。如果你的需求是解决怎样快速查询出结果,那么ClickHouse也许可以解决你的问题。
2021-04-01 14:33:15 107KB clickhouse olap 大数据 内存数据库
1
数据仓库的构建说明,包括使用的工具,需求分析,概要设计,和使用说明
2021-03-31 12:27:17 636KB 数据仓库 构建 设计 使用说明
1
实时数据仓库2....[付空].1551235212.pdf
2021-03-25 15:24:02 1.35MB 实时数仓
1
ETL工具--kettle资源库表结构说明,有比较详尽的中文注释,方便二次开发使用 excel格式,示例如下: 表名 表注释 字段名 字段注释 字段类型 是否可为NULL r_database 数据库连接 NAME 数据库连接名称 varchar(255) YES
2021-03-24 10:05:03 29KB etl java 数据挖掘 数据仓库
1
由于impala处理日期的函数如date_sub(),date_trunc(),last_day()等这些日期处理函数还需要进行日期格式化为yyyy-MM-dd使用,sql代码段过长,导致频繁嵌套过于复杂.所以自定义udf函数解决这些问题.以下为实现过程.
2021-03-23 20:02:51 10KB impala udf 数据仓库 sql
1
申明:只适用于基于hive搭建的大数据数仓,其他不要下载,谢谢,适用与想从事数仓架构师和数仓开发人员,或者想入门数据仓库开发的人,大数据开发想整体了解数仓只看这个就够了,项目中用到的整体规范文档,包括数仓的规范,日常开发规范,解释spark脚本规范,其中数仓分层,数仓的命名,都是项目中实际用到的落地方案
2021-03-22 11:15:54 923KB 数据仓库 大数据 hive
1