时间序列分析和预测:用电量模型
概括:
在美国东部的各种相关公用事业集团内,通过互连电网区域开发电力消耗的时间序列分析和预测。数据来自州际输电公司PJM Interconnection LLC的Kaggle( )。
数据整理:
数据以各种.csv文件的形式下载,使用pandas加入pandas DataFrame中,并根据开销的PJM Interconnect公司中不同公用事业组织的重叠年份(6年)进行汇总。每个公用事业公司每小时以兆瓦每小时的价格下载数据,然后每天,然后每周汇总。
探索性数据分析
每年都有季节性,这表明冬季和夏季的用电量都有所增加,用电量的峰值和谷值很少出现(很可能与不可预见的事件如极端天气事件有关)。在整个6年的分析期间,数据似乎保持平稳,这是通过对dicky-fuller检验进行分析而得出的。
训练-测试数据集
数据的前5年用于训练模型,数据的6年用于测试集。
造型
1