阀门控制的强化学习
版本2.1。 2021年3月10日:改进了文档,为希望将代码适应自己的工厂系统的新开发人员提供
Elsevier的MLWA(机器学习与应用程序)期刊的文档记录
该项目将DDPG用于非线性阀的“最佳”控制。 使用MATLAB R2019a和Simulink。
本文介绍了使用MATLAB的强化学习工具箱为非线性设备(例如阀门)创建“最佳”控制器的方法。 “分级学习”是一种简单的“指导”方法,它使人们可以更有效地训练代理。 该论文对研究过程中的学习进行了高度整理,并将观察结果与以前发表的文献相联系,以解决在使用DDPG和强化学习进行最佳控制时经常遇到的挑战。 虽然代码和纸张将Valve用作“工厂”,但这些方法和代码很容易适用于任何工业工厂。
请注意-分级学习是课程学习的最简单形式(以及面向应用/实践的形式)。
文档分为三个部分:
如何按原样运行MATLAB代码和Sim
2021-07-11 11:18:05
5.88MB
MATLAB
1