搜索【强化学习算法】的结果

基于Q-learning的改进版强化学习算法

经过算法改进，实现了比Q学习更快的收敛速度，可以快速的找到最短路径，程序使用了matlab语言，适合初学者，也适合科研硕士研究。

2021-11-28 12:07:36 49KB matlab 路径规划 人工智能 强化学习

torchrl：强化学习算法的Pytorch实现（软演员评论员（SAC）DDPG TD3 DQN A2C PPO TRPO）-源码

火炬RL RL方法的Pytorch实现支持具有连续和离散动作空间的环境。支持具有1d和3d观察空间的环境。支持多进程环境要求一般要求火炬1.7 健身房（0.10.9） Mujoco（1.50.1）列表（用于日志） tensorboardX（日志文件输出）张量板要求 Tensorflow：启动tensorboard或读取tf记录中的日志安装使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求用法在配置文件中指定算法的参数，并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息目前包含：政策上的方法：加强 A2C（演员评论家） PPO（近端政策优化）

2021-11-23 11:43:20 170KB algorithm reinforcement-learning pytorch dqn

1

强化学习算法资料.7z

资源其中包括A3C ,DQN ,PPO,概率图论及Sutton强化学习导论的教材等，具有很好的学习价值

2021-10-08 18:49:53 34.01MB Reinforcement le

1

广告优化：使用强化学习算法（如汤普森采样和上限可信度）来优化最佳广告-源码

广告优化：使用强化学习算法（如汤普森采样和上限可信度）来优化最佳广告

2021-10-04 08:42:30 61KB data-science reinforcement-learning eda data-visualization

1

Python-gymgazebo2是一个工具包用于开发和比较使用ROS2和Gazebo的强化学习算法

gym-gazebo2是一个工具包，用于开发和比较使用ROS 2和Gazebo的强化学习算法

2021-09-28 20:41:16 5.68MB Python开发-机器学习

1

基于深度强化学习算法的自主式水下航行器深度控制

研究了基于深度强化学习算法的自主式水下航行器（AUV）深度控制问题。区别于传统的控制算法，深度强化学习方法让航行器自主学习控制律，避免人工建立精确模型和设计控制律。采用深度确定性策略梯度方法设计了actor与critic两种神经网络。actor神经网络给出控制策略，critic神经网络用于评估该策略，AUV的深度控制可以通过训练这两个神经网络实现。在OpenAI Gym平台上仿真验证了算法的有效性。

2021-09-22 14:40:09 1.62MB 自主式水下航行器 深度控制 深度强化学习

1

DeepRL-TensorFlow2：using使用TensorFlow2轻松实现各种流行的深度强化学习算法-源码

TensorFlow2中的深度强化学习是一个使用实现各种流行的深度强化学习算法的存储库。该存储库的关键是易于理解的代码。因此，如果您是学生或研究深度强化学习的研究人员，我认为这是使用此存储库学习的最佳选择。一种算法仅依赖于一个python脚本文件。因此，您不必进出不同的文件即可研究特定的算法。该存储库将不断更新，并将继续添加新的“深度强化学习”算法。演算法 DQN 纸上作者Volodymyr Mnih，Koray Kavukcuoglu，David Silver，Alex Graves，Ioannis Antonoglou，Daan Wierstra，Martin Rie

2021-09-16 15:45:40 378KB machine-learning reinforcement-learning deep-learning tensorflow

1

Python-TensorFlow实现的强化学习算法集锦

Reinforcement Learning implementations and research prototyping in TensorFlow

2021-09-14 19:33:33 128KB Python开发-机器学习

1

a2c-ppo-ddpg:强化学习算法a2c，ppo和ddpg的实现-源码

a2c-ppo-ddpg

2021-09-10 13:33:08 80KB Python

1

基于DDPG强化学习算法的水下机器人姿态控制python代码.rar

DDPG强化学习算法, 姿态控制, python代码

2021-08-29 20:03:04 10KB DDPG 姿态控制 python代码

个人信息

热门下载

最新下载

其他资源