为促进居民用户柔性负荷高效参与需求响应,帮助
用户从被动角色转变为主动角色,实现需求侧最大效益。本文在智能电网环境下,根据用电设备的特性,以概率论
的角度对家电设备状态进行描述定义,基于异步深度强化
学习(asynchronous deep reinforcement learning,ADRL)进
行家庭能源管理系统调度的在线优化。学习过程采用异步
优势演员-评判家(asynchronous advantage actor-critic,
A3C)方法,联合用户历史用电设备运行状态的概率分布,
通过多智能体利用CPU 多线程功能同时执行多个动作的
决策。该方法在包括光伏发电、电动汽车和居民住宅电器
设备信息的某高维数据库上进行仿真验证。最后通过不同
住宅情境下的优化决策效果对比分析可知,所提在线能耗
调度策略可用于向电力用户提供实时反馈,以实现用户用
电经济性目标。
1