绝对的干货,包含常规在大数据游戏行业看板、自助分析指标
2022-02-24 19:02:32 40KB 数据分析 游戏 big data
“大数据”是一个涵盖多种技术的概念,简单地说,是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。IBM将“大数据”理念定义为4个V,即大量化(Volume)、多样化(Variety)、快速化(Velocity)及由此产生的价值(Value)。
1
利用Hive进行复杂用户行为大数据分析及优化案例(全套视频+课件+代码+讲义+工具软件),具体内容包括: 01_自动批量加载数据到hive 02_Hive表批量加载数据的脚本实现(一) 03_Hive表批量加载数据的脚本实现(二) 04_HIve中的case when、cast及unix_timestamp的使用 05_复杂日志分析-需求分析 06_复杂日志分析-需求字段讲解及过滤 07_复杂日志分析-字段提取及临时表的创建 08_复杂日志分析-指标结果的分析实现 09_Hive中数据文件的存储格式介绍及对比 10_常见的压缩格式及MapReduce的压缩介绍 11_Hadoop中编译配置Snappy压缩 12_Hadoop及Hive配置支持snappy压缩 13_Hive中的常见调优 14_Hive中的数据倾斜及解决方案-三种join方式 15_Hive中的数据倾斜及解决方案-group by 16_Hive中使用正则加载数据 17_Hive中使用Python脚本进行预处理
2022-02-21 22:06:13 28.25MB Hadoop Hive 大数据 性能调优
大数据分析公司网站模板是一款适合股票证券类数据公司网站模板下载。.zip大数据分析公司网站模板是一款适合股票证券类数据公司网站模板下载。.zip
2022-02-21 09:07:36 1.77MB 数据分析 数据挖掘
【金融大数据分析】CAPM练习
2022-02-19 13:50:24 175KB 金融 python
1
大数据分析平台总体架构——数据存储层 业务系统前日增量数据 缓存数据,支持后续ELT数据处理 数据内容 主要用途 数据模型 保留周期 用户 访问模式 工作负载 平台要求 贴源数据模型 保存最近7天数据 贴源数据区和主题数据区批量作业访问 无最终用户访问 I/O敏感,连续小批量的数据抽取和加载 少量量数据使用Hive的Load命令,大量数据使用MR程序 与主题区/贴源区/集市区构成一个Hadoop集群(Hive) 无单点故障,7×24小时+非工作日有限停机 主题数据区、集市数据区和沙盘演练数据区批量作业访问 无最终用户访问 I/O敏感,日终批量ETL 以ELT形式通过Hive SQL执行 与主题区/贴源区/集市区构成一个Hadoop集群(Hive) 无单点故障,7×24小时+非工作日有限停机 贴源数据模型 不保存历史 业务系统前日快照数据和一段时间的流水数据 数据标准化,为后续主题模型、集市和沙盘演练提供数据 临时数据区 贴源数据区
2022-02-18 20:56:33 5.01MB 大数据 电商 系统架构
1
使用Logistic回归进行预测建模时,重要的是要了解预测建模的主要目标,要达到的业务目标以及达到该目标的基本步骤。 目标 在本主题中,您将学习执行以下操作: • 确定预测建模的目标 • 定义预测建模元素的术语 • 解释预测建模的基本步骤 • 识别预测建模的业务应用 • 识别业务场景数据问题
2022-02-18 20:54:37 6.6MB 高级预测模型 回归分析 大数据分析
1
01_大数据项目的开发流程 02_大数据的应用领域(一) 03_大数据的应用领域(二) 04_大数据分析平台(一) 05_大数据分析平台(二) 06_数据量及集群规模的规划(一) 07_数据量及集群规模的规划(二) 08_企业常见数据分析需求(一) 09_企业常见数据分析需求(二)
2022-02-17 14:15:27 332.04MB 大数据 Hadoop 大数据开发 大数据分析平台
做大数据分析的“SAP”99click成电商成败杀手锏.pdf
2022-02-14 14:00:16 13KB 互联网
Level Ⅲ大数据分析师 55.9G的学习资料 资料全面,包含大纲和学习计划表 百度网盘
2022-02-13 14:34:52 116B CDA 大数据
1