针对煤炭企业数据处理能力的不足,将云计算技术应用到煤炭企业数据共享体系中,提出了一个利用Hadoop平台对煤炭企业数据进行高效共享的系统。首先,介绍了Hadoop平台及其关键技术;而后建立了应用于煤炭企业的数据共享模型,该模型抽取源数据并通过数据集成存储于数据仓库;最后结合煤炭企业实际需求,设计了数据管理平台,完成了数据集成、模型和并行关联算法的设计。
2021-06-12 22:22:56 277KB 煤炭企业 云计算 Hadoop 数据共享
1
淘宝数据仓库架构实践全讲解 数据仓库如何为业务赋能:一点资讯数据仓库实践 数据仓库ETL工具箱合集 58交易营销数据仓库建设 AWS 上的数据仓库 数据仓库维度建模工具箱指南 Hadoop数据仓库实践大全 全数据仓库生命周期工具箱精华
《Hadoop构建数据仓库实践》,高清,有详细目录,PDF版
2021-05-19 15:51:36 14.62MB Hadoop 数据仓
1
个人总结,目前大数据平台中常用的技能
2021-05-11 20:02:14 89KB 大数据 hadoop 数据仓库
1
Hadoop是大数据处理主流框架,如果要学习大数据处理与存储,hadoop是必须掌握的一种框架技术。动手安装是最基础的实践, 内含2.7.6 和2.7.7 教程:https://blog.csdn.net/llm765800916/article/details/114323454
2021-03-03 21:10:58 415.11MB 大数据 linux hadoop 数据挖掘
1
谷粒影音数据集,Hive项目之谷粒影音:ETL清洗原数据、Hive统计视频观看数top10、视频类别top、视频观看数top其所属类别、类别流量top、类别热度top、上传视频用户数量top、类别视频观看top
2021-01-28 04:24:53 120.45MB 大数据 hive hadoop 数据集
1
1、随机生成大文本文件(以行方式存储),文件存储在HDFS中,并将文件信息写入HBase中。 2、选择AES加密算法对生成的文件进行加密操作,秘钥长度为128位,加密后的文件存储HDFS中,秘钥写入HBase 3、从HBase中读取相应的文件名和秘钥,对文件进行解密操作,解密后的文件存储在HDFS中。 4、比较初始文件与解密后的文件内容一致性 5、统计操作总时长及各操作步的总时长
2021-01-28 04:21:27 47KB hdfs hbase ase hadoop
1
Hadoop数据导入导出 :Flume收集数据-安装讲课
2021-01-28 04:20:38 2.18MB flume
1