相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。 主类继承了的 。 如果使用参数'single-agent = True'实例化,则其行为类似于来自的常规 。 负责使用 API检索信息并在交通信号灯上。 该存储库的目标: 提供一个简单的界面,以与使用SUMO的交通信号控制强化学习一起使用 支持Multiagent RL 与gym.Env和流行的RL库(例如和 易于定制:状态和奖励定义易于修改 安装 安装最新版本的SUMO: sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量(默认的sumo安装路径为/ usr / share / sumo) ec
2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms
1
博主目前是一名研一的学生,本篇PPT是通过论文来对AlphaGo进行介绍,其中包含两篇alphago自然论文,一共58页。
2021-08-25 20:25:21 13.07MB AlphaGo AlphaGo Zero 强化学习
1
关于迷宫类的强化学习(Q-learning)matlab完整代码
2021-08-25 10:40:40 2KB 强化学习
1
阿卡多斯 快速和嵌入式求解器,用于非线性最优控制。 一般的 acados提供了与C , Python , MATLAB和Octave编程语言的接口 可以在上找到 论坛:如果您有与Acados有关的任何问题,请随时在我们的论坛。 引用acados:可在和找到参考。 安装 初始化所有子模块 git submodule update --recursive --init 生成并安装acados 。目前同时支持基于CMake和基于Makefile的构建系统。请选择一个并继续执行相应的段落。 CMake的 设置BLASFEO_TARGET在/CMakeLists.txt 。有关受支持目标的列表,请参阅 。如下安装acados mkdir -p build cd build cmake .. # with optional arguments e.g. -DACADOS_W
2021-08-24 19:26:02 21.72MB embedded control optimization nonlinear
1
最优控制》课程ppt.zip
2021-08-24 19:21:00 27.14MB 最优控制
讲述强化学习中应用差分隐私的方法,对应的论文为《Differentially Private Reinforcement Learning》
2021-08-23 20:59:27 7.54MB 强化学习 差分隐私
1
David Silver的强化学习基本上算是强化学习的入门视频,学习强化学习的人必看。这是David Silver强化学习课程学习笔记,除了视频里的内容,每一章节末尾附加了练习,便于实现和理解算法
2021-08-23 15:06:15 3.56MB RL 强化学习 深度强化学习 David
1
强化学习资料
2021-08-22 18:13:44 16.97MB 逆强化学习 python
1
连续状态自适应离散化基于K-均值聚类的强化学习方法.pdf
2021-08-21 13:03:32 300KB 聚类 算法 数据结构 参考文献