搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

《最优控制》期末试卷2021真题

研究生《最优控制》期末试卷2021真题；Problems for examination 1) Explain briefly the features of the main approaches and the relationship between these approaches used to solve optimal control problems. (20 points)；

2022-05-23 14:03:41 163KB 最优控制 期末考试 中南大学

深度强化学习在自动驾驶运动规划中的应用

DRL从游戏到自动驾驶驾驶策略智能化建模面向无人车运营的持续改进系统框架模型和预监督主算法效果优化探索策略演进探索策略优化案例演示大集合效果

2022-05-23 11:20:53 7.08MB 自动驾驶 游戏 人工智能 机器学习

1

基于深度强化学习的电网紧急控制策略研究.pdf

：提出一种基于深度强化学习的电网切机控制策略，所提控制策略依据电网运行环境信息，通过数据分析得到切机控制策略。首先介绍强化学习框架，阐述学习算法原理，并详细介绍Q-Learning 方法。然后介绍深度学习基本概念和深度卷积网络原理，提出利用深度卷积网络提取电网运行特征，构建切机策略的思路。再结合深度学习和强化学习，构建深度强化学习框架，其中深度学习采用深度卷积神经网络模型用于提取特征，强化学习采用双重Q-Learning 和竞争 Q-Learning 模型计算Q 值，通过比较Q 值大小得到切机控制策略。最后，利用IEEE 39 节点系统验证了方法的正确性。

2022-05-22 10:56:50 1.13MB 基于深度强化学习的电网紧急控制策

1

论文研究-基于平均奖赏强化学习算法的零阶分类元系统.pdf

零阶学习分类元系统ZCS（Zeroth-level Classifier System）作为一种基于遗传的机器学习技术（Genetics-Based Machine Learning），在解决多步学习问题上，已展现出应用价值。然而标准的ZCS系统采用折扣奖赏强化学习技术，难于适应更为广泛的应用领域。基于ZCS的现有框架，提出了一种采用平均奖赏强化学习技术（R-学习算法）的分类元系统，将ZCS中的折扣奖赏强化学习方法替换为R-学习算法，从而使ZCS一方面可应用于需要优化平均奖赏的问题领域，另一方面则可求解规模较大、需要动作长链支持的多步学习问题。实验显示，在多步学习问题中，该系统可给出满意解，且在维持动作长链，以及克服过泛化问题方面，具有更优的特性。

2022-05-22 10:50:16 644KB 论文研究

1

矩阵对策Matlab代码-L2RPN-using-A3C:使用Actor-Critic框架进行L2RPN挑战的强化学习(https://l2r

矩阵指针Matlab代码L2RPN-使用-A3C 使用 Actor-Critic 框架进行 L2RPN 挑战 ( & ) 的强化学习。使用此代码训练的代理是挑战的获胜者之一。代码使用pypownet环境()。该代码是在 LGPLv3 许可下发布的。要求 Python >= 3.6 凯拉斯 pypownet 虚拟环境 (conda/venv) 推荐 Pypownet 安装和文档：文件说明 PDF文件 Amar_L2RPN_IJCNN_git.pdf - 在 IJCNN-2019 的 L2RPN 研讨会上介绍该方法。总结方法和培训方法中的想法。 Numpy 文件 valid_actions_array_uniq.npz - 有效唯一动作矩阵 valid_actions_masking_subid_perm.npz - 将变电站 Id 映射到用于屏蔽参与者输出的唯一有效动作的矩阵 Python文件 valid_switching_controls.py - 创建上述 numpy 文件的 python 文件 pypow_14_a3c_final.py - 用于使用 A3C 训练演员

2022-05-21 12:56:16 44.1MB 系统开源

1

Recent Advances in Reinforcement Learning Theory.pdf

强化学习(RL)通过与复杂环境的交互，推动机器学习从基础数据拟合到学习和规划的新时代。RL具有深度学习功能，在自动驾驶、推荐系统、无线通信、机器人、游戏等领域取得了巨大的成功。RL的成功很大程度上是基于RL算法的基础发展，直到最近才被彻底理解，特别是它们的有限时间收敛速度和样本复杂性。本教程将全面概述基础RL算法的理论理解的最新进展，利用随机近似/优化理论和利用RL问题的马尔可夫结构。本教程还将介绍一些高级的RL算法及其最近的发展。

2022-05-20 22:05:09 5.94MB 强化学习

LQR系统最优控制器设计的MATLAB实现及应用_马娟丽.pdf

比较细致讲解了应用LQR系统对经典倒立摆的最优控制，并在matlab上实现并仿真对比

2022-05-20 15:24:45 219KB LQR

1

强化学习算法：一些流行的RL算法的实现

安装首先在requirements.txt安装需求，然后运行pip install -e .

2022-05-20 11:20:21 932KB JupyterNotebook

1

编写按键精灵脚本的小技巧

给初学者学习用

2022-05-20 09:05:28 24.32MB 强化学习

1

线性二次型的最优控制

通俗易懂，容易理解，自己看了之后感觉不错，分享给大家，

2022-05-19 14:49:30 1.24MB 线性二次型 最优控制

1

个人信息

热门下载

最新下载

其他资源