搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

sumo-rl:一个简单的界面，用于通过SUMO实例化强化学习环境，以进行交通信号控制。与OpenAI的Gym Env和RLlib的MultiAgentEnv兼容-源码

相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。主类继承了的。如果使用参数'single-agent = True'实例化，则其行为类似于来自的常规。负责使用 API检索信息并在交通信号灯上。该存储库的目标：提供一个简单的界面，以与使用SUMO的交通信号控制强化学习一起使用支持Multiagent RL 与gym.Env和流行的RL库（例如和易于定制：状态和奖励定义易于修改安装安装最新版本的SUMO： sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量（默认的sumo安装路径为/ usr / share / sumo） ec

2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms

1

time-optimal nonlinear model predictive control.pdf

时间最优MPC

2021-08-25 21:03:39 6.64MB MPC 运动规划 最优控制

1

AlphaGo两篇自然论文演讲汇报

博主目前是一名研一的学生，本篇PPT是通过论文来对AlphaGo进行介绍，其中包含两篇alphago自然论文，一共58页。

2021-08-25 20:25:21 13.07MB AlphaGo AlphaGo Zero 强化学习

1

强化学习matlab代码

关于迷宫类的强化学习（Q-learning）matlab完整代码

2021-08-25 10:40:40 2KB 强化学习

1

acados:快速和嵌入式求解器，用于非线性最优控制-源码

阿卡多斯快速和嵌入式求解器，用于非线性最优控制。一般的 acados提供了与C ， Python ， MATLAB和Octave编程语言的接口可以在上找到论坛：如果您有与Acados有关的任何问题，请随时在我们的论坛。引用acados：可在和找到参考。安装初始化所有子模块 git submodule update --recursive --init 生成并安装acados 。目前同时支持基于CMake和基于Makefile的构建系统。请选择一个并继续执行相应的段落。 CMake的设置BLASFEO_TARGET在/CMakeLists.txt 。有关受支持目标的列表，请参阅。如下安装acados mkdir -p build cd build cmake .. # with optional arguments e.g. -DACADOS_W

2021-08-24 19:26:02 21.72MB embedded control optimization nonlinear

1

《最优控制》课程ppt.zip

2021-08-24 19:21:00 27.14MB 最优控制

强化学习ppt.pdf

讲述强化学习中应用差分隐私的方法，对应的论文为《Differentially Private Reinforcement Learning》

2021-08-23 20:59:27 7.54MB 强化学习 差分隐私

1

David Silver强化学习课程学习笔记中文

David Silver的强化学习基本上算是强化学习的入门视频，学习强化学习的人必看。这是David Silver强化学习课程学习笔记，除了视频里的内容，每一章节末尾附加了练习，便于实现和理解算法

2021-08-23 15:06:15 3.56MB RL 强化学习 深度强化学习 David

1

lets-do-irl-master.zip

逆强化学习资料

2021-08-22 18:13:44 16.97MB 逆强化学习 python

1

连续状态自适应离散化基于K-均值聚类的强化学习方法.pdf

2021-08-21 13:03:32 300KB 聚类算法 数据结构 参考文献

个人信息

热门下载

最新下载

其他资源