kettle 8.2数据仓库零基础快速入门对应课程配套资源
2021-02-07 18:02:16 425.5MB kettle8.2 数据仓库
1
python实现 DBSCAN K-means OPTICS PAM 谱聚类
2021-02-03 23:57:10 4.41MB 数据仓库 聚类 算法 python
1
数据仓库与数据挖掘练习数据
2021-02-03 11:03:51 8.49MB 数据分析
1
数仓经典销售案例,包括ETL脚本,项目完整详细需求、设计文档及模型加载,推荐。
2021-02-01 12:11:50 1.81MB 数仓 数据仓库
玛拉示例项目 一个可运行的应用程序,演示了如何使用mara构建数据仓库。 将库和库与框架结合到一个项目中。 示例ETL将PyPi下载统计信息和GitHub回购活动度量标准集成到了更通用的Python项目活动统计信息中。 该存储库旨在用作新项目的模板。 示例:Python项目统计 该项目使用两个数据源: 在 (需要Google登录)上BigQuery数据集。 它包含每个单独的软件包下载以及项目和客户端属性。 BigQuery资料集位于 。 它几乎包含所有发生在Github存储库中的事件。 从两个数据源中,使用的查询以增量方式下载一组预先聚合和过滤的CSV: $ gunzip --decompress --stdout data/2018/04/10/pypi/downloads-v1.csv.gz | grep " \tflask\t\|day_id " | head -n 11 day_id project project_version python_version installer number_of_downloads 20180410 flask 0.1 ban
2021-01-30 23:04:36 17.65MB bigquery sql etl pypi
1
南京大学《数据仓库与知识发现》期末考试试卷
2021-01-28 11:51:02 5.6MB 数据仓库
基于Flink SQL的扩展工作,构建实时数仓的应用案例,未来工作的思考和展望4个方面介绍了OPPO基于Flink构建实时数仓的经验和未来的规划。
2021-01-28 04:27:20 1.48MB FLINK 大数据 实时数仓
1
实时数据仓库 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。
2021-01-28 04:27:17 1.34MB 实时计算 实时数据仓库
1
大数据项目实战之在线教育(02数仓实现).doc
2021-01-28 04:26:39 4.1MB 数据仓库
1
该资源包含了《大数据之路-阿里巴巴大数据》这本书的整体思维导图,并且按照自己从业经验进行归纳整理,囊括了:数据采集,数据计算,数据模型,数据管理,数据生命周期的相关知识点
1