只为小站
首页
域名查询
文件下载
登录
DeepReinforcementLearning-DDPG-for-RoboticsControl:这是名为深度确定性策略梯度(DDPG)的
深度强化学习
算法的实现,以训练4自由度机械臂达到移动目标。 动作空间是连续的,学习的特工为机器人输出扭矩以移动到特定目标位置-源码
DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的
深度强化学习
算法的实现,用于训练4自由度机械臂以达到移动目标。 动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。 环境 一个包含20个相同代理的,每个代理都有其自己的环境副本。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 解决环境 您的特工平均得分必须为+30(超过100个连续剧集,并且超过所有特工)。 具体来说,在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个
2021-04-29 11:38:55
20.38MB
JupyterNotebook
1
视觉推送抓取:通过
深度强化学习
来训练机器人特工来计划计划的推动和抓握动作,以进行操纵-源码
视觉推送和抓取工具箱 视觉推送和抓取(VPG)是一种训练机器人代理以学习如何计划互补的推送和抓取操作以进行操纵(例如,用于非结构化的放置和放置应用程序)的方法。 VPG直接在视觉观察(RGB-D图像)上运行,从试错中学习,快速训练,并推广到新的对象和场景。 该存储库提供PyTorch代码,用于在UR5机械臂的模拟和实际设置中通过
深度强化学习
来训练和测试VPG策略。 这是本文的参考实现: 通过自我监督的
深度强化学习
来学习推动和抓握之间的协同作用 , ,( ,( ,( ,( 2018年IEEE / RSJ国际智能机器人和系统国际会议(IROS) 熟练的机械手操作得益于非灵活(例如推
2021-04-27 12:45:57
13.81MB
computer-vision
deep-learning
robotics
deep-reinforcement-learning
1
深度强化学习
A2C算法实现
完整实现A2C算法,包括实现要点、模型构建、虚拟环境交互、模型训练、信息监控等,并亲测在google colab中运行
2021-04-21 20:58:57
5.39MB
PyTorch
深度强化学习
A2C
深度学习
1
LIRD:电影
深度强化学习
推荐系统-源码
LIRD:基于
深度强化学习
的“明智”推荐框架 电影
深度强化学习
推荐系统 这篇文章的重新实现:深强化学习的名单明智的建议- 原始源代码: :
2021-04-18 22:53:37
837KB
系统开源
1
keras-rl:Keras的
深度强化学习
-源码
Keras的
深度强化学习
它是什么? keras-rl在Python中实现了一些最先进的
深度强化学习
算法,并与深度学习库无缝集成。 此外, keras-rl可与一起使用。 这意味着评估和使用不同算法很容易。 当然,您可以根据自己的需要扩展keras-rl 。 您可以使用内置的Keras回调和指标,也可以定义自己的回调和指标。 更重要的是,只需扩展一些简单的抽象类,即可轻松实现自己的环境甚至算法。 文档可。 包含什么? 到目前为止,已实现以下算法: 深度Q学习(DQN) , Double DQN 深度确定性策略梯度(DDPG) 连续DQN(CDQN或NAF) 交叉熵方
2021-04-17 20:32:03
882KB
machine-learning
theano
reinforcement-learning
tensorflow
1
基于
深度强化学习
的混合动力汽车能源管理策略.zip
基于
深度强化学习
的混合动力汽车能量管理策略
2021-04-16 18:01:51
5.53MB
电动汽车
深度强化学习
能量管理
机器学习
RL-Stock:用如何用
深度强化学习
自动炒股-源码
:chart_increasing:如何用
深度强化学习
自动炒股 :light_bulb:初衷 最近发生的事故,受到新冠疫情的影响,股市接连下降,作为一棵小白菜兼小韭菜,竟然产生了抄底的大胆想法,拿出仅存的一点私房钱梭哈了一把。 第二天,暴跌,俺加仓 第三天,又跌,俺加仓 第三天,又跌,俺又加仓... 一番错误操作后,结果严重不堪重负,第一次买股票就被股市一段暴打,受到了媳妇无情的嘲讽。痛定思痛,俺决定换一个思路:如何用
深度强化学习
来自动模拟炒股?实验验证一下能否获得收益。 :open_book:监督学习与强化学习的区别 监督学习(如LSTM)可以根据各种历史数据来预测未来的股票的价格,判断股票是涨还是跌,帮助人做决策。 而强化学习是机器学习的另一个分支,在决策的时候采取适当的行动(Action)使最后的奖励最大化。与监督学习预测未来的数值不同,强化学习根据输入的状态(如当日开盘价,收盘价等),输出系列动作(例如:买进,持有,卖出),从而最后的收益最大化,实现自
2021-04-11 14:03:47
4.14MB
JupyterNotebook
1
记忆增强型
深度强化学习
研究综述
近年来,
深度强化学习
的取得了飞速发展,为了提高
深度强化学习
处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到
深度强化学习
,并提出了不同的记忆增强型
深度强化学习
算法,记忆增强型
深度强化学习
已成为当前的研究热点.
2021-04-07 09:14:10
1.25MB
记忆增强
强化学习
1
Air Dominance Through Machine Learning.pdf
【兰德公司报告】通过机器学习获得空中优势—人工智能辅助任务规划的初步探索 Air Dominance Through Machine Learning:A Preliminary Exploration of Artificial Intelligence–Assisted Mission Planning
2021-03-24 22:03:57
13.67MB
人工智能
智能规划
深度强化学习
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
MATLAB之LSTM预测
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
转速、电流双闭环直流调速Simulink源文件.zip
token登录器.rar
鲸鱼优化算法 WOA matlab源代码(详细注释)
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
Alternative A2DP Driver 1.0.5.1 无限制版
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
刚萨雷斯《数字图像处理》第四版答案.pdf
Spring相关的外文文献和翻译(含出处).zip
2010年-2020中国地面气候资料数据集(V3.0)
西门子逻辑控制设计开发_3部10层
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
MTALAB NSGA2算法
Autojs 例子 源码 1600多个教程源码
最新下载
get_dll_from_dumped_bin.zip
苹果Mac OS VMware Tools Darwin.rar
10.11.6.txt
Mac os 10.11.6.txt
MySQL——长途汽车管理系统(c语言版,含报告和表结构)
springCloud毕业设计管理系统,我的毕设项目.zip
Qt 实现 自定义窗口标题栏
北大青鸟调试软件
北大青鸟软件资料
消防报警主机日探编程软件.rar
其他资源
GD32F450I开发板资料
HTML静态网页作业
UBOOT代码详细分析(88页PDF)
股票代码列表_20210227_171609.rar
dnn_app_utils_v2.py 和 datasets
基于Python实现全局和局部双变量Moran指数计算
上海各级道路矢量图
perl 下dmake 所需要的 安装文件
第三方串口类
MATLAB二维码识别平台
单片机LED爱心灯心形流水灯源码制作教程原理图PCB.zip
阿里巴巴编码规范(Java)满分答卷
天津天地伟业 笔试题
CSS笔记(1).pdf
Linux 环境变量配置全攻略.doc
FindPic.zip
Win7禁止程序联网小工具绿色版.rar
用C#winForm 实现的人机对战的五子棋
网页实训加网页代码
MFC socket 局域网聊天
Heritrix测试war包
MFC邮件收发器 SMTP POP3
离散和连续空间中的最优搜索理论
json-lib-2.2.2-jdk15.jar
人力资源管理asp.net