搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

4.3 DQN 思维决策 using Tensorflow (强化学习 Reinforcement Learning 教学)

#4.3_DQN_思维决策_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)

2021-09-01 21:00:17 52.49MB 学习资源

4.2 DQN 神经网络 using Tensorflow (强化学习 Reinforcement Learning 教学)

#4.2_DQN_神经网络_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)

2021-09-01 21:00:15 25.98MB 学习资源

4.1 DQN 算法更新 using Tensorflow (强化学习 Reinforcement Learning 教学)

#4.1_DQN_算法更新_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)

2021-09-01 21:00:13 15.67MB 学习资源

3.3 Sarsa(lambda) (强化学习 Reinforcement Learning 教学)

#3.3_Sarsa(lambda)__(强化学习_Reinforcement_Learning_教学)

2021-09-01 21:00:10 24.27MB 学习资源

3.2 Sarsa 思维决策 (强化学习 Reinforcement Learning 教学)

#3.2_Sarsa_思维决策__(强化学习_Reinforcement_Learning_教学)

2021-09-01 21:00:09 18.89MB 学习资源

3.1 Sarsa 算法更新 (强化学习 Reinforcement Learning 教学)

#3.1_Sarsa_算法更新__(强化学习_Reinforcement_Learning_教学)

2021-09-01 21:00:07 12.89MB 学习资源

Maximum Entropy Inverse Reinforcement Learning- Presentation PPT

逆强化学习配套专栏2-最大熵学习的会议论文-presentation的PPT，含paper的主要思想和公式

2021-09-01 14:13:16 180KB 人工智能 强化学习 信息熵

1

用深度强化学习玩雅达利-------汇总

2021-09-01 09:13:45 60KB 神经网络

1

基于视觉注意机制深度强化学习的行人检测方法.pdf

2021-08-31 18:03:03 6.11MB 互联网 资料

非线性阀门控制的强化学习：将 DDPG 应用于非线性阀门的“最佳”控制。可适用于其他模拟植物。-matlab开发

概括： * 此代码随附于题为“阀门控制的强化学习”的论文https://doi.org/10.1016/j.mlwa.2021.100030 * 该论文探讨了 RL 对非线性系统的优化控制* 平台：MATLAB 的强化学习工具箱（R2019a 版）和 Simulink * 运行 `main.m` 以执行测试运行以确保代码正常工作。它依次运行4个代码文件。它将训练一个只有 100 集的代理，将其存储在 `\results` 文件夹中，根据 PID 对其进行验证，执行稳定性分析（在现有的传递函数数据文件上，存储在 `\data` 文件夹中）并生成绘图和将它们存储在\ results文件夹中。 #### 训练 RL 控制器： * `code_DDPG_Training.m`：使用DDPG以分阶段方式训练代理的训练代码。使用 sm_DDPG_Training_Circuit.slx。该

2021-08-30 10:55:08 5.86MB matlab

1

个人信息

热门下载

最新下载

其他资源