可用于光伏预测,机器学习等领域。
来源于国能日新光伏功率预测大赛。
具体介绍可参考DC竞赛里的国能日新光伏功率预测大赛。
处理分析网络上有若干帖子。
训练集和测试集的描述如下: 训练集有train_1.csv(66859条数据), train_2.csv(43755条数据), train_3.csv(29792条数据), train_4.csv(42687条数据)共4个文件,测试集有test_1.csv(11808条数据),test_2.csv(14688条数据),test_3.csv(6182条数据),test_4.csv(13894条数据)共4个文件,分别为电场1,电场2,电场3,电场4的训练集数据和测试集数据。训练集字段包括时间、辐照度、风速、风向、温度、压强、湿度、实发辐照度、实际功率;测试集数据字段,除无字段实发幅照度和实际功率外,增加了id列为样本id,每条记录的样本id是唯一值,其它字段同训练集数据。 1. 实际功率中的负值是因为机组在发电不足时自身会消耗电能。 2. 实际辐照度的负值视为噪声数据。 3. 实测数据中有明显异常的数据可进行剔除处理。
2022-05-14 12:05:17
3.65MB
机器学习
预测