清洗后的数据:包括全国333地级市的十年气象数据,包括省份地区、年份、时间、天气状况、最高气温、最低气温 、风向(早)、风力(晚上)等,记录数据将近90W行,并附中国二级行政区域对照表 原始数据集:包含34个省级行政区所有二级行政区的数据按照城市为单位,比如陕西为例(西安、宝鸡、咸阳、铜川、渭南、延安、榆林、汉中、安康、商洛共十个地级市数据都有,每一个地级市有单独文件) 爬虫项目源码:源码为Python代码、使用idea运行,也可以使用VScode运行,采用requests-bs4模式爬取数据。Requests模块用于网页信息提取,get方法获取参数;BeautifulSoup用于网页解析,获取网页内容 分析结果PPT,分析过程采用Tableau软件,天气预测总结如下:总结结果是为了完成项目组任务。 1、全国温度最高的前十个省份的夏季温度持续保持在40℃以上,这正好贴切的反映出当前全球变暖的情况,为我们保护环境敲响了警钟。 2、内陆地区昼夜温差大于沿海地区,所以我们应该时刻关注天气情况,注意增减衣物。 3、风力最强的季节往往都是春季,这也是我国北方和西北地区沙尘暴频发的一个季节,在春季来临之前做好预防可以大幅度降低国家和人民的财产损失。 4、西安市最常出现的是多云和晴天,这也是西安气候干燥的原因,我们应该从日常做起,节约用水,使水资源可持续循环使用。
2021-12-17 11:04:07 74.03MB 天气数据集 python 分析结果 数据分析
pybufr_ecmwf 介绍 BUFR是用于交换气象观测数据的世界气象组织(WMO)标准文件格式。 Pybufr_ecmwf是一个python模块,用于读取和写入BUFR文件以及组成BUFR模板。 pybufr_ecmwf模块为ECMWF bufrdc库提供python接口,并允许以BUFR格式读取和写入文件。 除了bufrdc fortran库提供的功能之外,此python模块还增加了创建BUFR模板并将结果写入BUFR表的可能性,ECMWF BUFRDC库可以使用该表 API由几层组成: 将python连接到fortran库的原始/裸露的fortran / c API(pybufr_ecmwf.ecmwfbufr) 围绕该原始层的中间python API(pybufr_ecmwf.bufr_interface_ecmwf) 一个高级API,允许使用面向对象的pythonic。
2021-12-13 15:46:01 17.88MB Python
1
The photosynthetically active radiation (PAR) was calculated from sunshine hours using the method of FAO and Penman-Monteith formula as follows:
2021-12-12 22:06:15 2KB Python
Hadoop气象数据Hadoop气象数据Hadoop气象数据Hadoop气象数据Hadoop气象数据
2021-12-11 14:15:49 22.11MB Hadoop数据
1
包含全国气象站点的坐标、编号和所属省份。
2021-12-10 13:06:52 128KB 气象数据
1
提出一种计及历史气象数据的短期风速预测方法。首先将历史风速数据和历史气象数据作为风速预测的原始输入,采用混合特征选择(HFS)方法对输入向量进行删选,选取与预测风速强相关的变量,生成预测模型的输入特征集;然后运用异方差高斯过程回归(HGP)模型进行建模,该模型能体现风速的随机性。根据某实测风速数据进行提前1 h风速预测,结果表明所提方法能提高风速预测精度。
1
对于学习大数据的最好的数据集,数据简单,但是网络上只有少数几年的数据,规模不大,本人直接从美国ncdc官网爬下来的(每次只能上传220,所以需要分批上传)
2021-11-28 10:43:30 169.63MB hadoop dataset spark scala
1
.grib、.grib2、.grb、.grb2、.nc 文件网格数据集抽取工具 命令调用示例: java -jar GribFileCut.jar ***.Grib ***.nc tem,win_u,win_v [70.0,140.0,0.0,60.0] 参数1:.grib、.grib2、.grb、.grb2、.nc 文件等需要抽取数据的源文件。 参数2:抽取后输出的文件,只能是.nc格式。 参数3:要抽取的网格数据名称,从源文件中查看。多个以","间隔。 参数4:网格数据裁剪范围,不传则不裁剪。
2021-11-25 14:02:59 29.34MB 气象 grib nc 裁剪
1
针对如何从海量的气象数据中挖掘出有用的知识,并提高气象预报的准确度,提出了在Hadoop平台上构建基于遗传神经网络算法的天气预报方法.该方法采用遗传算法与神经网络算法相结合,避免了传统算法容易陷入局部最优的问题,并以天津市13个台站1951–2006年的地面气候资料日值数据为基础,建立了遗传神经网络预测模型,最后以降雨量等级为决策属性进行了实验.结果表明,该方法对所有降水等级的预测准确率都要优于传统的神经网络算法,对于降水等级R0的预测精度最高,达到了87%,不仅可以有效的处理海量气象数据,同时具有较高的预测精准度和良好的扩展性,为天气预报提拱了一种全新的思路和方法.
2021-11-12 21:32:00 1.18MB Hadoop 遗传神经网络 气象数据 天气预报
1
中国全国地面站点数据(1981-2010)、月平均气象、月平均降水、月平均相对湿度、月最大降水、月最高温度最低温度、月最高温平均值最低温平均值、高低温站点基础数据 b_china_mon_avg_data_pressure月平均气象 b_china_mon_avg_data_rain月平均降水 b_china_mon_avg_data_rhu月平均相对湿度 b_china_mon_max_data_rain月最大降水 b_china_mon_max_min_data_tem月最高温度最低温度 b_china_mon_max_min_avg_data_tem月最高温平均值最低温平均值 b_china_mon_max_min_station高低温站点基础数据 数据库文件
2021-11-09 17:16:31 839KB 气象数据 气温降水 天气数据