数据仓库:数据仓库笔记本和项目-源码

上传者: 42109639 | 上传时间: 2021-02-09 09:07:08 | 文件大小: 14KB | 文件类型: ZIP
数据仓库 介绍 在这个项目中,我构建了一条ETL管道来帮助一家音乐流媒体启动公司Sparkify从AWS S3 (数据存储)中提取其数据,将它们暂存到AWS Redshift中,并将数据转换为一组维度表,以便他们的分析团队可以分析用户正在收听的歌曲。 要求 该项目需要以下内容: 有权创建IAM角色并配置AWS Redshift的AWS账户 数据集:两个公共S3存储桶。 一个存储桶包含有关歌曲和艺术家的信息,第二个存储桶包含有关用户的信息。 安装与设置 对于数据库架构 登台表 staging_songs-存储歌曲和艺术家 staging_events-存储用户执行的操作 事实表 songplays -与歌曲相关联的事件数据记录玩弄页NextSong即记录 尺寸表 用户-应用中的用户 歌曲-音乐数据库中的歌曲 artist-音乐数据库中的艺术家 时间-歌曲播放记录的时间戳分为特定单位 数据仓

文件下载

资源详情

[{"title":"( 7 个子文件 14KB ) 数据仓库:数据仓库笔记本和项目-源码","children":[{"title":"DataWarehouses-main","children":[{"title":"README.md <span style='color:#111;'> 1.99KB </span>","children":null,"spread":false},{"title":"Exercise","children":[{"title":"L1 E1 - Step 1 & 2.ipynb <span style='color:#111;'> 28.08KB </span>","children":null,"spread":false},{"title":"L1 E1 - Step 3.ipynb <span style='color:#111;'> 38.20KB </span>","children":null,"spread":false}],"spread":true},{"title":"Project","children":[{"title":"dwh.cfg <span style='color:#111;'> 210B </span>","children":null,"spread":false},{"title":"etl.py <span style='color:#111;'> 691B </span>","children":null,"spread":false},{"title":"sql_queries.py <span style='color:#111;'> 5.22KB </span>","children":null,"spread":false},{"title":"create_tables.py <span style='color:#111;'> 671B </span>","children":null,"spread":false}],"spread":true}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明