本教程以离线综合项目实战-日志流量分析为例全程演示了数据仓库设计与分析模型构建,内容包括但不限于: 01 PageView模型的介绍及实现思路分析 02 PageView分析模型Mapper代码的实现 03 PageView分析模型Driver代码的实现(一) 04 PageView分析模型Driver代码的实现(二) 05 PageView模型结果测试及Visit模型实现思路分析 06 Visit分析模型Mapper代码的实现 07 Visit分析模型Reduce代码的实现(一) 08 Visit分析模型Reduce代码的实现(二) 09 数据仓库的设计与数据仓库实现思路 10 事实表的创建与入库 11 Hive高级函数的使用与详细表的实现分析 12 数据分析详细表的实现
2022-05-16 19:08:41 860.01MB 大数据、 数据仓库 大数据分析 分析模型
大数据分析之网站业务数据分析实战,全套视频+讲义+笔记+代码,内容包括但不限于: - PV分析与受访分析 - 访客分析与Visit模型分析 - PageView模型分析 - 任务调度与数据展示
2022-05-16 19:08:36 409.17MB 大数据 大数据分析 网站分析 PVUV
山量数据ai选股系统,和通达信软件关联,点击股票代码,股票名,行业等在通达信查看。系统包括ai主力行为分析等技术面选股和财务面选股,所以可以排除垃级股。非常牛x。
1
商业银行大数据分析的思考与实践.pptx
2022-05-13 14:08:39 2.5MB 数据分析 文档资料 数据挖掘
大数据分析文件,提供给开发者的测试的数据,数据样本(218.87.132.193 - - [30/May/2013:19:06:12 +0800] "GET /static/image/common/swfupload.swf?preventswfcaching=1369911981262 HTTP/1.1" 200 13333)
2022-05-09 20:56:56 10.64MB hadoop 数据分析文件
1
本次要实践的数据日志来源于国内某技术学习论坛,该论坛由某培训机构主办,汇聚了众多技术学习者,每天都有人发帖、回帖。至此,我们通过Python网络爬虫手段进行数据抓取,将我们网站数据(2013-05-30,2013-05-31)保存为两个日志文件,由于文件大小超出我们一般的分析工具处理的范围,故借助Hadoop来完成本次的实践。 使用python对原始数据进行清洗,以便后续进行统计分析; 使用Hive对清洗后的数据进行统计分析; 使用Sqoop把Hive产生的统计结果导出到mysql中; 两个日志文件,一共有200MB,符合大数据量级,可以作为推荐系统数据集和hadoop测试集。
2022-05-09 19:14:04 13.7MB 数据分析 hadoop 文档资料 python
随着条形码、二维码、RFID、工业传感器、自动控制系统、工业互联网、ERP、CAD/CAM/CAE等信息技术在工业领域的广泛应用,大量与工业生产活动相关的数据被实时采集并存储到企业的信息系统中。对这些数据进行分析,有助于改进生产工艺、提高生产效率、降低生产成本,为实现智能制造奠定基础。因此,工业大数据分析引起了工业界和学术界的广泛关注。模型和算法是大数据分析理论和技术中的两个核心问题。介绍了工业大数据分析的基本概念,综述了几种流行的工业大数据分析模型在工业大数据分析领域的应用情况以及相应求解算法方面的研究成果,并探索了大数据分析模型和算法的未来研究方向。
2022-05-08 09:10:52 972KB 数据分析 算法 文档资料 数据挖掘
医疗健康大数据分析平台规划设计方案(专业版).docx
2022-05-07 09:07:27 65KB 数据分析 数据挖掘
一种基于大数据分析的互联网信息安全用杀毒系统.pdf
2022-05-06 18:00:11 928KB 数据分析 文档资料 数据挖掘
2022年交通物流运输行业大数据分析解决方案(完整版).pdf
2022-05-05 13:01:15 8.51MB 智慧