威斯康星辍学预警系统 欢迎使用威斯康星辍学预警系统 (DEWS)。 DEWS 是基于 R 统计计算语言的 DPI 数据仓库构建的机器学习应用程序。 DEWS 旨在成为一个灵活的半自动化机器学习系统,它评估数十种可能的机器学习算法以预测辍学,并选择性能最高的模型来为当前学生分配风险评分。 DEWS 背后的许多细节已经在其他地方进行了讨论,包括在 DPI 网站上: : 。 Knowles 2015 中讨论了机器学习方法的技术细节。 本文档用于描述 DEWS 程序本身。 DEWS 在设计上是一个模块化应用程序,允许它灵活地适应 DPI 的数据变化、新措施的可用以及新的机器学习技术的开发。 这种模块化由四个主要子程序组成(Knowles 2015)。 准备环境 数据采集 转换数据 火车模型 评分案例 每个子程序中都有许多步骤。 在大多数情况下,DEWS 包含一个自定义 R 函数来应用这些步
2021-07-18 17:03:09 83KB R
1
新华保险数据仓库建设方案 目录: 公司介绍 EDW总体规划方案 EDW整体技术架构方案 EDW数据模型解决方案 EDW业务应用解决方案 EDW建设战略与实施方法 EDW项目一期实施方案 EDW建设最佳实践经验 交流答疑
2021-07-17 21:51:58 13.44MB 数据仓库 商业智能 系统建设方案
1
以xx国寿为例分析了保险行业BI报表的技术架构及数据仓库,通过阅读本文,可以初步理解保险行业的BI发展,及报表在BI行业的应用。
2021-07-17 21:49:36 486KB 技术架构
1
使用VS2019编写的MFC连接Mysql数据库项目实例! 包含了查询 连接 显示 修改等功能 可以供初学者学习!
2021-07-17 15:03:03 117.84MB mfc MYSQL 数据库 数据仓库
1
基于阿里云搭建数据仓库
2021-07-16 17:07:00 732KB hadoop flume
1
上百节课视频详细讲解,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 本课程采用由浅入深,层层递进的讲解方式, 让你轻松掌握企业级数仓架构的搭建及使用, 使用该架构可以胜任企业级实时数仓和离线数仓构建。 课程内容: 1. 项目背景介绍 2. 数据建模应用 3. 基于Kylin的OLAP分析 4. 需求分析与项目设计 5. 订单与销售额指标计算 6.行为指标计算 7.Druid的安装和使用 8.流式数仓实现 适用人群: 1、对企业级数据仓库构建感兴趣,有一定大数据基础。 2、对目前职业有进一步提升要求,希望从事数据行业高薪工作的在职人员。 3、对数据行业感兴趣的相关人员。 基础课程主讲内容包括: 阶段一:千亿级实时数仓项目总体介绍 1. 数据仓库在企业里面的重要性 2. 千亿级实时数仓的项目演示 阶段二: 数据建模的应用 1. 为什么要数据建模 2. 维度和指标的概念 3. 指标和维度建模案例 阶段三. 数据仓库从0到1的过程 1. 数仓典型分层思想(ODS、DWB、DWS、DM、ADS) 2. 数仓建设0到1的过程实战 3. 企业级数据仓库设计的规范 阶段四:基于Kylin的OLAP分析 1. Kylin自带的example案例介绍 2. Kylin的Cube创建 3. Kylin的数据膨胀介绍 阶段五:需求分析与项目设计 1. 需求分析 2. canal搭建 3. canal数据写入kafka 阶段六:订单与销售额指标计算 1. 销售额指标体系介绍 2. flink实时消费Kafka订单数主题数据 3. 订单金额指标统计 阶段七:行为指标计算 1. 模拟通过埋点方式采集行为数据 2. 使用Flink Streaming计算用户行为相关指标 3. Flink CEP实现转化率分析 阶段八: Druid的安装和使用 1. Druid实时数据摄入 2. Druid基于JSON查询语法 3. Imply Pivot可视化数据分析
2021-07-16 09:10:52 75B 数据仓库 Kylin 大数据 flink
尚硅谷大数据gmall数据表
2021-07-15 20:01:44 697KB 大数据 数据仓库
1
尚硅谷大数据数仓项目gmall的sql数据
2021-07-15 20:01:43 697KB 大数据 数据仓库
1
hadoop大数据平台技术与应用--第6章数据仓库Hive.pdf
2021-07-14 15:01:56 1.35MB hadoop hive
1
九种数据仓库产品及解决方案九种数据仓库产品及解决方案九种数据仓库产品及解决方案九种数据仓库产品及解决方案
2021-07-14 11:06:49 41KB 九种数据仓库产品及解决方案
1