DeepReinforcementLearning-DDPG-for-RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,以训练4自由度机械臂达到移动目标。 动作空间是连续的,学习的特工为机器人输出扭矩以移动到特定目标位置-源码

上传者: 42141437 | 上传时间: 2021-04-29 11:38:55 | 文件大小: 20.38MB | 文件类型: ZIP
DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。 动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。 环境 一个包含20个相同代理的,每个代理都有其自己的环境副本。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 解决环境 您的特工平均得分必须为+30(超过100个连续剧集,并且超过所有特工)。 具体来说,在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个

文件下载

资源详情

[{"title":"( 12 个子文件 20.38MB ) DeepReinforcementLearning-DDPG-for-RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,以训练4自由度机械臂达到移动目标。 动作空间是连续的,学习的特工为机器人输出扭矩以移动到特定目标位置-源码","children":[{"title":"DeepReinforcementLearning-DDPG-for-RoboticsControl-main","children":[{"title":"ddpg_agent.py <span style='color:#111;'> 5.34KB </span>","children":null,"spread":false},{"title":"finaltraining.png <span style='color:#111;'> 29.11KB </span>","children":null,"spread":false},{"title":"ou_noise.py <span style='color:#111;'> 792B </span>","children":null,"spread":false},{"title":"DeepReinforcementLearning.gif <span style='color:#111;'> 19.95MB </span>","children":null,"spread":false},{"title":"DDPG Report.pdf <span style='color:#111;'> 173.09KB </span>","children":null,"spread":false},{"title":"replay_buffer.py <span style='color:#111;'> 1.97KB </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.04KB </span>","children":null,"spread":false},{"title":"Continuous_Control.ipynb <span style='color:#111;'> 39.38KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 2.92KB </span>","children":null,"spread":false},{"title":"ddpg_models.py <span style='color:#111;'> 3.55KB </span>","children":null,"spread":false},{"title":"actor_solved.pth <span style='color:#111;'> 206.85KB </span>","children":null,"spread":false},{"title":"critic_solved.pth <span style='color:#111;'> 208.65KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明