云计算大作业使用Hadoop对美国新冠肺炎疫情数据分析项目。 实验内容 统计指定日期下,美国每个州的累计确诊人数和累计死亡人数。 对实验1的结果按累计确诊人数进行倒序排序。(重写排序规则) 对实验1的结果再运算,统计截止指定日期,全美各州的病死率。病死率 = 死亡数/确诊数。 统计美国截止每日的累计确诊人数和累计死亡人数。做法是以date作为分组字段,对cases和deaths字段进行汇总统计。 对实验4的结果再运算,统计美国每日的新增确诊人数和新增死亡人数。因为新增数=今日数-昨日数,所以考虑使用自连接,连接条件是t1.date = t2.date + 1,然后使用t1.totalCases – t2.totalCases计算该日新增。 对实验4的结果再运算,统计美国截止当日的病死率。 将美国不同州的疫情数据输出到不同文件,属于同一个州的各个县输出到同一个结果文件中。(重写排序规则,重写分区规则)。 统计指定日期下,美国每个州的确诊案例最多前N(TopN)的县。(重写排序规则,重写分组规则)
农业大数据分析应用平台解决方案.docx
2022-06-12 14:01:46 56KB 智慧
源代码和数据,数据说明:本数据集共收集了一个月内某猫商城的28010条数据,适合Python 新手的练习项目
2022-06-11 22:42:01 286KB 数据分析
1
本方案提供水里物联网及分析的整体解决方案,包括 1)设备及接入 提供水文监测、雨水情、气象、水质、土壤温湿度等物联网设备及设备接入能力。 2)定制开发 提供硬件设备的嵌入式改造服务;提供上层应用软件定制开发服务。 3)解决方案 提供基于橙鸟云水利物联网平台的标准化行业方案,推进项目快速落地 4)私有云部署 提供基于橙鸟云水利物联网平台的私有云服务,可根据客户需求部署到本地或客户指定地方。
1
sas压缩包 下载了打开就用 大赛第八季还不舍得八十八八十九办法就是但那是绝对南方科技撒比登记办法将分别v
2022-06-11 16:52:47 48.54MB sas 数据分析
1
pandas.fillna函数
2022-06-10 18:07:28 12KB 学习笔记 缺失值填充 数据分析 python
1
Python银行反欺诈项目代码,数据已脱敏处理,并只保留了部分数据。数据中有flag,in_date,ip,terminaltype phone,versioncode,userno,certno这几列,根据训练集进行学习,在测试集上进行测试,得到还不错的评估指标。
2022-06-10 18:07:27 42.85MB 反欺诈 数据分析 python
1. 什么是追涨杀跌? 2. 追涨杀跌的建型和实现 3. 模型优化 4. 在云端建模 – 况客平台 快速知变,分析消息、量能、对周边各种因素的影响 • 善于观察,盘面、形态、消息、舆论等方面的细微变化,对大盘作出准确估量 • 善于思考,大盘与目标股之问的正向、反向的相关性 • 利好出尽是利空,当市场利好消息接踵而至时,应随时准备卖出股票
2022-06-10 13:12:26 1.63MB 量化投资 R语言
1
面试数据分析师时面试官喜欢问的问题.pdf,这是一份不错的文件
2022-06-10 09:04:06 590KB 文档