一个比较简单的深度强化学习训练过程仿真,输出奖励值
2022-05-05 21:05:32 946B 文档资料 深度强化学习
在matlab中使用强化学习算法实现路径规划
2022-05-05 17:23:46 1KB matlab 强化学习 路径规划
动态优化程序包。适用于常微分系统,有路径约束的最优控制问题的求解。算法:微分方程有限元离散+隐式梯度计算+SQP求解优化问题
2022-05-05 09:04:58 310KB matlab
自动泊车 Autoparking模拟一个典型的停车场的情况,其目的是重新定位了一系列manuevers的汽车,而附近的避开障碍物。 多亏了流行的强化学习算法Q-Learning,我证明了汽车能够自行停车,而无需任何外部输入。 一切,包括AI逻辑,都是从头开始用C ++实现的。 唯一的依赖关系是开源图形库( )。 想更多地了解它的工作原理? 观看或阅读简短的。 享受! Autopark训练模型演示 目录 跑步 关于 文件夹组织 bin- >包含构建后的可执行二进制文件构建- >包含编译过程中生成的.o目标文件缓存->包含Q和R的预训练权重,因此您可以跳过学习阶段conf- >包含配置文件docs- >包含.pdf文件,其中包含有关该项目的有趣信息。 看看吧! 字体->包含应用程序使用的几种字体img- >包含上面的gif图像Makefile- >只是一个makefile 自述文
1
大数据-算法-非直井迹最优控制模型算法及应用.pdf
2022-05-04 14:09:00 5.92MB 算法 big data 文档资料
基于值函数和策略梯度的深度强化学习综述
2022-05-04 14:06:44 1.65MB 源码软件
一种基于遗传算法的模糊神经网络最优控制
Q-learning是一种无模型强化学习算法。Q-learning的目标是学习一个策略,,包括前馈、反向传播、梯度下降等。 基于深度强化学习Qlearning的智能小车避障训练和测试,带操作界面,matlab2021a测试运行。运行时,注意matlab操作界面左侧的路径窗口,必须是该文件夹,以供matlab调用各个子函数。
大数据-算法-非线性动态系统的稳定性和鲁棒控制理.pdf
2022-05-03 19:09:56 6.42MB big data 算法 文档资料
大数据-算法-非线性多阶段最优控制系统理论算法及应用.pdf
2022-05-03 19:09:52 5.06MB 算法 big data 文档资料