DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。 动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。 环境 一个包含20个相同代理的,每个代理都有其自己的环境副本。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 解决环境 您的特工平均得分必须为+30(超过100个连续剧集,并且超过所有特工)。 具体来说,在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个
2021-04-29 11:38:55 20.38MB JupyterNotebook
1
领英为了限制大家滥加人,对每周设置邀请上限,当达到上限后无法再发邀请,这时怎么办呢?
1
中国远程医疗2030年市场规模将达到1万亿元人民币
2021-04-09 09:03:57 1.28MB 中国远程医疗2030年市场规模将
基于python+tensorflow的srcnn超分辨率重构代码(基本可以达到论文中的效果),优于基本上网上的大部分代码,网上大部分代码效果离理想效果差5-6db,而我这个资源把里面的坑踩掉了。可以结合我主页的博客看会更容易理解。下载后请先阅读说明文档。对应博客:https://blog.csdn.net/weixin_43723423/article/details/108368746
中国远程医疗:到2030年,市场规模将达到1万亿元人民币
中国远程医疗:到2030年,市场规模将达到1万亿元人民币.pdf
2021-03-30 12:04:40 2.91MB 中国远程医疗
Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料
2021-03-08 12:06:04 508.89MB python 千锋python 笔记 课件
1
转盘式激光器能够达到高功率
2021-03-05 09:08:42 378KB 论文
1
串口操作,实现时间校对,准确率达到10毫秒,具有很高的研究价值
1
更新说明 1.优化数据结构; 2.后台全新UI; 3.新增验证码功能; 4.新增防xss功能; 5.新增在线上传工具功能; 6.新增编辑首页功能; 7.新增多模版; 8.前台优化数据结构; 演示地址 – 不保证时效 https://tool.baifan97.cn/ 搭建说明 1.全新一键安装:http://你的域名/install 2.后台管理地址:http://你的域名/admin.php 默认用户名:zye.cc 密码:123456
2021-03-01 20:04:09 114.41MB 白帆工具箱tools2.0整站源
1