-_11.11_storm-spark-hadoop hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) (1)用户订单入kafka队列, (2)经过storm,实时计算出总销售量,和各个省份的的销售量, (3)将计算结果保存到hbase数据库中。 第二阶段(离线报表) (1)用户订单入oracle数据库, (2)通过sqoop把数据导入hadoop上。 (3)使用mr和rdd对hadoop上的原始订单做etl清洗 (4)建立hive表和sparkSQL内存表。为后期分析做基础 (5)使用HQL实现业务指标分析,和用户画像分析,将结果存在mysql中。供web前台使用 第三阶段(大规模订单即席查询,和多维度
2021-06-22 15:04:33 26KB Java
1
20210621-中信证券-奥特维-688516-投资价值分析报告:串焊机龙头,多维度布局打开成长空间.pdf
2021-06-22 09:03:24 1.77MB 行业
20210612-广发证券-知乎-ZH.US-稀缺社区生态,多维度提升商业化能力.pdf
2021-06-15 18:04:14 1.9MB 行业
20210611-东方证券-阿里巴巴~SW-9988.HK-天猫及618专题报告:多维度优化运营策略,全面焕新平台活力.pdf
2021-06-12 09:02:14 1.51MB 行业
此应用程序将针对不同的非量纲压力梯度P值绘制速度随距离的变化
2021-06-10 21:15:13 46KB matlab
1
传统的电力巡线方式主要大量的人力物力存在效率低,劳动强度大,风险高,巡检结果不够丰富,电力空间管理数据库不完善等问题,为了解决目前存在的问题需要考虑通过多种方式多种模式来联合解决。 电力线存在的多样化现状,决定了需要根据实际的需求来选择合适高效节约成本的巡线平台。 建立电力巡线的大数据势必需要多维度的数据实行全方位的数据分析和总结。 多机种,多维度的巡线数据成果需要大数据的概念进行管理分析以及对外融合。
2021-06-06 15:01:36 7.66MB 智慧电力 电力巡检
淘宝数据仓库架构实践全讲解 数据仓库如何为业务赋能:一点资讯数据仓库实践 数据仓库ETL工具箱合集 58交易营销数据仓库建设 AWS 上的数据仓库 数据仓库维度建模工具箱指南 Hadoop数据仓库实践大全 全数据仓库生命周期工具箱精华
阿里巴巴:多维度布局自动驾驶&车联网.pdf
2021-06-02 18:03:21 2.23MB 自动驾驶 车联网
此函数使用 plot3 和前 3 个维度来生成点的 3D 图。 然后,通过在深红色和蓝色颜色之间进行线性插值,使用第 4 维的值生成点的颜色。
2021-06-01 12:03:01 4KB matlab
1
DBSCAN算法是一种基于密度的聚类算法。针对该算法在处理混合属性数据上的不足,采用面向维度的距离的思想,对不同类型的数据定义不同的相似度度量方法和不同的相似度阚值,减少了对全局相似度阈值的依赖,提出了一种新的适合混合属性数据聚类的算法M-DBSCAN。仿真表明新算法有效解决了DBSCAN算法无法处理混合属性数据的缺点,对混合属性数据有较好的聚类效果。
2021-05-30 14:03:53 268KB 自然科学 论文
1