经过算法改进,实现了比Q学习更快的收敛速度,可以快速的找到最短路径,程序使用了matlab语言,适合初学者,也适合科研硕士研究。
2021-11-28 12:07:36 49KB matlab 路径规划 人工智能 强化学习
火炬RL RL方法的Pytorch实现 支持具有连续和离散动作空间的环境。 支持具有1d和3d观察空间的环境。 支持多进程环境 要求 一般要求 火炬1.7 健身房(0.10.9) Mujoco(1.50.1) 列表(用于日志) tensorboardX(日志文件输出) 张量板要求 Tensorflow:启动tensorboard或读取tf记录中的日志 安装 使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求 用法 在配置文件中指定算法的参数,并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息 目前包含: 政策上的方法: 加强 A2C(演员评论家) PPO(近端政策优化)
2021-11-23 11:43:20 170KB algorithm reinforcement-learning pytorch dqn
1
资源其中包括A3C ,DQN ,PPO,概率图论及Sutton强化学习导论的教材等,具有很好的学习价值
2021-10-08 18:49:53 34.01MB Reinforcement le
1
广告优化:使用强化学习算法(如汤普森采样和上限可信度)来优化最佳广告
1
gym-gazebo2是一个工具包,用于开发和比较使用ROS 2和Gazebo的强化学习算法
2021-09-28 20:41:16 5.68MB Python开发-机器学习
1
研究了基于深度强化学习算法的自主式水下航行器(AUV)深度控制问题。区别于传统的控制算法,深度强化学习方法让航行器自主学习控制律,避免人工建立精确模型和设计控制律。采用深度确定性策略梯度方法设计了actor与critic两种神经网络。actor神经网络给出控制策略,critic神经网络用于评估该策略,AUV的深度控制可以通过训练这两个神经网络实现。在OpenAI Gym平台上仿真验证了算法的有效性。
1
TensorFlow2中的深度强化学习 是一个使用实现各种流行的深度强化学习算法的存储库。 该存储库的关键是易于理解的代码。 因此,如果您是学生或研究深度强化学习的研究人员,我认为这是使用此存储库学习的最佳选择。 一种算法仅依赖于一个python脚本文件。 因此,您不必进出不同的文件即可研究特定的算法。 该存储库将不断更新,并将继续添加新的“深度强化学习”算法。 演算法 DQN 纸上 作者Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex Graves,Ioannis Antonoglou,Daan Wierstra,Martin Rie
1
Reinforcement Learning implementations and research prototyping in TensorFlow
2021-09-14 19:33:33 128KB Python开发-机器学习
1
DDPG强化学习算法, 姿态控制, python代码
2021-08-29 20:03:04 10KB DDPG 姿态控制 python代码