fxgl_jc_hjp_jy0201.doc
2021-08-29 13:08:02 2.09MB 强化学习
1
fxgl_jc_hjp_jy0301.doc
2021-08-29 13:08:02 2.76MB 强化学习
1
【python逆强化学习系列】学徒学习+gym的MountainCar仿真(建议Linux环境运行),内涵requirments.txt环节配置文件,Human Expert制作单步仿真文件,训练曲线(png)和效果图(gif)。
2021-08-27 19:14:43 252KB python 逆强化学习 学徒学习 gym
1
中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
2021-08-26 16:45:05 1.68MB 马尔科夫决策过程 强化学习
1
相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。 主类继承了的 。 如果使用参数'single-agent = True'实例化,则其行为类似于来自的常规 。 负责使用 API检索信息并在交通信号灯上。 该存储库的目标: 提供一个简单的界面,以与使用SUMO的交通信号控制强化学习一起使用 支持Multiagent RL 与gym.Env和流行的RL库(例如和 易于定制:状态和奖励定义易于修改 安装 安装最新版本的SUMO: sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量(默认的sumo安装路径为/ usr / share / sumo) ec
2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms
1
博主目前是一名研一的学生,本篇PPT是通过论文来对AlphaGo进行介绍,其中包含两篇alphago自然论文,一共58页。
2021-08-25 20:25:21 13.07MB AlphaGo AlphaGo Zero 强化学习
1
关于迷宫类的强化学习(Q-learning)matlab完整代码
2021-08-25 10:40:40 2KB 强化学习
1
阿卡多斯 快速和嵌入式求解器,用于非线性最优控制。 一般的 acados提供了与C , Python , MATLAB和Octave编程语言的接口 可以在上找到 论坛:如果您有与Acados有关的任何问题,请随时在我们的论坛。 引用acados:可在和找到参考。 安装 初始化所有子模块 git submodule update --recursive --init 生成并安装acados 。目前同时支持基于CMake和基于Makefile的构建系统。请选择一个并继续执行相应的段落。 CMake的 设置BLASFEO_TARGET在/CMakeLists.txt 。有关受支持目标的列表,请参阅 。如下安装acados mkdir -p build cd build cmake .. # with optional arguments e.g. -DACADOS_W
2021-08-24 19:26:02 21.72MB embedded control optimization nonlinear
1
最优控制》课程ppt.zip
2021-08-24 19:21:00 27.14MB 最优控制