搜索【rl】的结果

prob_mbrl 基于概率模型的RL的Deep-PILCO及其变体的实现。这是算法的（正在进行中）重新实现。我们还旨在将其他基于概率模型的RL方法添加到该库中。推荐的安装方式：安装Miniconda 3发行版： ://conda.io/miniconda.html conda install pytorch cuda90 cudnn -c pytorch conda install tqdm 要运行mc-pilco cartpole示例，您还需要安装kusanagi库（）。我们计划在将来消除这种依赖性。例如，有关如何使用此库的信息，请查看notbooks文件夹。目前，我们有一个使用BNN模型进行回归的示例，还有一个MC PILCO的示例

2021-08-27 16:03:06 905KB JupyterNotebook

1

sumo-rl:一个简单的界面，用于通过SUMO实例化强化学习环境，以进行交通信号控制。与OpenAI的Gym Env和RLlib的MultiAgentEnv兼容-源码

相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。主类继承了的。如果使用参数'single-agent = True'实例化，则其行为类似于来自的常规。负责使用 API检索信息并在交通信号灯上。该存储库的目标：提供一个简单的界面，以与使用SUMO的交通信号控制强化学习一起使用支持Multiagent RL 与gym.Env和流行的RL库（例如和易于定制：状态和奖励定义易于修改安装安装最新版本的SUMO： sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量（默认的sumo安装路径为/ usr / share / sumo） ec

2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms

1

David Silver强化学习课程学习笔记中文

David Silver的强化学习基本上算是强化学习的入门视频，学习强化学习的人必看。这是David Silver强化学习课程学习笔记，除了视频里的内容，每一章节末尾附加了练习，便于实现和理解算法

2021-08-23 15:06:15 3.56MB RL 强化学习 深度强化学习 David

1

HVAC_RL:HVAC控制器的强化学习实施-源码

暖通空调在EnergyPlus模型中控制HVAC控制器Q学习和SARSA（lambda）算法以控制电加热器的强化学习实现

2021-08-18 21:07:06 8.7MB MATLAB

1

POMDP：基于部分可观察的马尔可夫决策过程实现RL算法-源码

POMDP：基于部分可观察的马尔可夫决策过程实现RL算法

2021-08-18 20:46:53 165KB reinforcement-learning matlab neuroscience reinforcement-learning-algorithms

1

FIRM An Intelligent Fine-grained Resource Management Framework

2021-08-18 13:37:32 1.2MB 微服务 RL

1

React Router如何在url参数不同的情况下跳转页面不更新解决方案

React Router如何在url参数不同的情况下跳转页面不更新解决方案说明解决方案及思路componentWillReceiveProps（nextProps）说明场景如下： {item.productName} 当前页面相同的url参数不同，并不会去重新触发我们的componentDidMount函数。所以导致页面不会更新。解决方案及思路此时，我们就需要用到react生命周期中的componentWillReceiveProps函数。 componentWillReceiveProps（nextProps）组件初次渲染时不会执行componentWillReceivePro

2021-08-13 16:20:19 41KB act c rl

1

Sutton 强化学习课程

Sutton早期开的强化学习课程合集，对强化学习的基础内容讲的比David Silver的课程更详细，更充实

2021-08-13 15:42:21 97.25MB Sutton 强化学习 RL

1

android_env:在 Android 设备上进行 RL 研究的库-源码

AndroidEnv - Android 学习环境是一个 Python 库，可将设备公开为强化学习 (RL) 环境。该库提供了一个灵活的平台，用于在 Android 操作系统之上定义自定义任务，包括任何 Android 应用程序。代理通过通用操作界面（触摸屏）与设备交互，方法是向系统发送本地化的触摸和抬起事件。该库处理这些事件并返回由特定提供的像素观察和奖励。例如，可能会根据研究目的和用户配置任务的方式，对成功向下滚动页面、发送电子邮件或在游戏中获得某些分数等事件给予奖励。指数环境特点有许多方面使 AndroidEnv 成为强化学习研究具有挑战性但合适的环境： AndroidEnv 允许代理与全球数十亿用户每天使用的系统进行交互，AndroidEnv 为 RL 代理提供了一个平台，用于导航、学习任务并在现实世界中产生直接影响。环境包裹了一个模拟的 Android 设备

2021-08-04 14:05:41 172.59MB android reinforcement-learning Python

1

nips2020model-based rl.zip

2020年nips model-based reinforcement learning相关论文集合

2021-08-03 17:09:56 17.32MB RL MBRL model-based 强化学习论文

1

个人信息

热门下载

最新下载

其他资源