搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

状态估计,最优控制与状态估计,matlab

使用S-function搭建的车辆状态估计simulink模型，包含EKF和CKF

2022-10-18 22:52:48 14KB SIMULINKCKF stateestimation vehicle 车辆状态估计

1

强化学习的Q-learning算法和sarsa算法以及结果图

路径规划问题，有三种环境配置可实现，以下是代码来源，基于此做的实验 https://blog.csdn.net/jacken3/article/details/119803094

2022-10-18 20:05:16 472KB 强化学习 路径规划

1

强化学习经典文献R-learning

Average reward reinforcement learning Foundations algorithms and empirical results (1996)：强化学习采用平均奖励目标函数

2022-10-17 17:07:24 2.14MB

1

策略梯度算法PPO+代码解读

2022-10-17 13:05:45 842KB 强化学习 PPO

1

REINFORCE理论+实现代码

2022-10-17 13:05:44 2.12MB 强化学习 REINFORCE 策略梯度 实现代码

1

第2课马尔可夫决策过程

2022-10-17 13:05:43 334KB 马尔可夫决策过程 MDP 强化学习

1

第4课强化学习中的蒙特卡洛方法

2022-10-17 13:05:41 2.03MB 强化学习 蒙特卡洛

1

第5课强化学习中的时间差分

2022-10-17 13:05:40 1.89MB TemporalDiffere 强化学习

1

第7课强化学习中的深度Q网络(DQN)

2022-10-17 13:05:36 570KB 强化学习 DQN

1

强化学习中的python和numpy编程基础

2022-10-17 13:05:35 78KB python numpy 强化学习

1