#4.3_DQN_思维决策_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:17 52.49MB 学习资源
#4.2_DQN_神经网络_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:15 25.98MB 学习资源
#4.1_DQN_算法更新_using_Tensorflow_(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:13 15.67MB 学习资源
#3.3_Sarsa(lambda)__(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:10 24.27MB 学习资源
#3.2_Sarsa_思维决策__(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:09 18.89MB 学习资源
#3.1_Sarsa_算法更新__(强化学习_Reinforcement_Learning_教学)
2021-09-01 21:00:07 12.89MB 学习资源
强化学习配套专栏2-最大熵学习的会议论文-presentation的PPT,含paper的主要思想和公式
2021-09-01 14:13:16 180KB 人工智能 强化学习 信息熵
1
用深度强化学习玩雅达利-------汇总
2021-09-01 09:13:45 60KB 神经网络
1
基于视觉注意机制深度强化学习的行人检测方法.pdf
2021-08-31 18:03:03 6.11MB 互联网 资料
概括: * 此代码随附于题为“阀门控制的强化学习”的论文https://doi.org/10.1016/j.mlwa.2021.100030 * 该论文探讨了 RL 对非线性系统的优化控制* 平台:MATLAB 的强化学习工具箱(R2019a 版)和 Simulink * 运行 `main.m` 以执行测试运行以确保代码正常工作。 它依次运行4个代码文件。 它将训练一个只有 100 集的代理,将其存储在 `\results` 文件夹中,根据 PID 对其进行验证,执行稳定性分析(在现有的传递函数数据文件上,存储在 `\data` 文件夹中)并生成绘图和将它们存储在\ results文件夹中。 #### 训练 RL 控制器: * `code_DDPG_Training.m`:使用DDPG以分阶段方式训练代理的训练代码。 使用 sm_DDPG_Training_Circuit.slx。 该
2021-08-30 10:55:08 5.86MB matlab
1