递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的
A GV 调度系统需要实时动态的调度方法, 而具有M axQ 递阶强化学习能力的多智能体通过高效的强化
学习方法和协作, 可以实现A GV 的实时调度。仿真实验证明了这种方法的有效性。
惯性权重是微粒群算法(PSO) 的重要参数, 它可以平衡算法的全局和局部搜索能力的关系, 改善算法的性
能. 对此, 提出一种基于强化学习的适应性微粒群算法(RPSO). 首先将不同惯性权重调整策略视为粒子的行动集合;
然后通过计算??函数值, 考察粒子多步进化的效果; 进而选择粒子最优进化策略, 动态调整惯性权重, 以增强算法寻
找全局最优的能力. 对几种经典函数的测试结果表明, RPSO 能够获得良好的性能, 特别是对多峰函数效果更加明显.