Druid 是一个分布式的、支持实时多维OLAP分析的数据处理系统。它既支持高速的数据实时摄入处理,也支持实时且灵活的多维数据分析查询。因此Druid最常用的场景就是大数据背景下、灵活快速的多维OLAP分析。 另外,Druid还有一个关键的特点:它支持根据时间戳对数据进行预聚合摄入和聚合分析,因此也有用户经常在有时序数据处理分析的场景中用到它
2019-12-21 20:07:12 35.42MB 大数据
1
课程简介: 某购物电商网站数据分析平台,分为收集数据、数据分析和数据展示三大层面。其中数据分析主要依据大数据Hadoop生态系统常用组件进行处理,此项目真实的展现了大数据在企业中实际应用。 课程内容 (1)文件收集框架 Flume ①Flume 设计架构、原理(三大组件) ②Flume 初步使用,实时采集数据 ③实际案例:使用Flume监控数据,实时收集存储HDFS中 (2)大数据分析平台架构 ①数据平台三大模块 让技术产生价值! ②分析平台业务数据 ③大数据平台技术选型和搭建配置测试 (3)数据分析平台七大业务分析 ①具体的七大业务分析,针对不同的数据 ②将数据收到 HDFS/Hive/HBase,使用MapReduce和Hive离线分析,其中涉及地域分析、用户相关信息分析及外链分析等。 ③依据业务深入MapReduce使用 ④数据处理时,针对不同问题如何优化调整等
2019-12-21 20:02:34 889B Hadoop
1
Twitter的数据集,用来进行大数据分析,可以对原始数据求聚类系数等 进行一系列操作处理
2019-12-21 19:59:10 21.3MB 大数据 Twitter
1
0 积分下载;文件大小:47.4 M;清晰完整中文扫描版,pdf文件,530页,对应英文书名为《Python for Finance》,译者:姚军。
2019-12-21 19:53:13 47.48MB python 程序设计 大数据 数据挖掘
1
京东金融大数据分析平台总体架构的ppt 做架构的可以借鉴一下
2019-12-21 19:50:02 4.08MB 金融 大数据 架构 平台
1
☆ 资源说明:☆ [Morgan Kaufmann] 大数据分析 (英文版) [Morgan Kaufmann] Big Data Analytics From Strategic Planning to Enterprise Integration with Tools, Techniques, NoSQL, and Graph (E-Book) ☆ 图书概要:☆ Big Data Analytics will assist managers in providing an overview of the drivers for introducing big data technology into the organization and for understanding the types of business problems best suited to big data analytics solutions, understanding the value drivers and benefits, strategic planning, developing a pilot, and eventually planning to integrate back into production within the enterprise. Guides the reader in assessing the opportunities and value proposition Overview of big data hardware and software architectures Presents a variety of technologies and how they fit into the big data ecosystem ☆ 出版信息:☆ [作者信息] David Loshin [出版机构] Morgan Kaufmann [出版日期] 2013年08月26日 [图书页数] 142页 [图书语言] 英语 [图书格式] PDF 格式
2019-12-21 19:46:57 1.66MB Big Data
1
清华大学《大数据分析》课程的课程资料,包括课程讲义、课程大纲等,是大数据学习的必读材料。
2019-12-21 19:44:09 38.52MB 清华大学 大数据分析 课程资料
1
主要讲述一个利用大数据平台对数据进行分析并图形化展示的一个项目
2019-12-21 19:32:32 1.55MB Hadoop hive hue linux
1
对此数据的分析过程以文档形式展现,且附有答辩PPT 代码实现了移动设备数据集的三个数据分析任务:预测年龄和性别 、分析最受欢迎的APP以及分析最受欢迎的手机品牌。实现过程主要使用了sklearn、pandas、numpy、pyplot等库 由于数据量太大,没有展示数据
2019-12-21 19:28:33 4.53MB python 大数据分析 数据分析模型
1
2018年度中国城市活力研究报告
2019-12-21 19:25:50 5.49MB 大数据分析
1