只为小站
首页
域名查询
文件下载
登录
DDPG_manual_sim.rar_DDPG_
DDPG代码
_强化学习_强化学习算法_运动
深度强化学习DDPG算法训练小车运动找球的代码
2023-01-21 02:02:33
5KB
ddpg
ddpg代码
强化学习
强化学习算法
ddpg:强化学习
ddpg代码
。 关注思想论文
ddpg DDPG(深度确定性策略梯度)在Gym-torcs上的实现。 与张量流。 ddpg论文: ://arxiv.org/pdf/1509.02971v2.pdf 作者:肯尼斯·于 安装依赖项: 张量流r1.4 gym_torcs: : 如何运行: 训练方式: python3 gym_torcs_train_low_dim.py 评估模式: python3 gym_torcs_eval_low_dim.py
2021-06-21 11:48:03
30KB
附件源码
文章源码
1
CNN+
DDPG代码
,主要实现了倒立摆的控制
I used the CNN + DDPG realizing inverted pendulum control python3.5 tensorflow + GPU gym环境。 本代码绝无仅有,自己用全连接修改的,输入的图像也是自己画的 其中CNN_1与CNN_2是根据全连接进行改造的 。 CNN_1中是在第二个卷积层的输出中加入Actor网络的输出Policy 。 CNN_2中是在第一个全连接的输出中加入Actor网络的输出Policy。
2019-12-21 19:34:41
55B
强化学习
深度学习
倒立摆
卷积神经网络
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
MPC 模型预测控制matlab仿真程序
科研伦理与学术规范 期末考试2 (40题).pdf
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
MATLAB车牌识别系统
scratch版 我的世界.sb2
EEupdate_5.35.12.0 win10下修改intel网卡mac
中国地面气象站观测数据2000-2021
基于LSTM模型的股票预测模型_python
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
基于ray filter的雷达点云地面过滤ROS节点
粒子群算法优化3-5-3多项式工业机器人时间最优轨迹规划算法matlab代码
雷达信号处理仿真程序(MTI,MTD等)
python实现的学生信息管理系统—GUI界面版
最新下载
校园导游系统课程设计报告
千分尺 螺旋测微器 flash动画
ROSE mirror HA 双机热备软件
魂斗罗素材
国开《计算机绘图》课程形考1-4 .dwg答案(可直接使用)
DS18B20温度采集+串口发送+模块化编程 51单片机
Plex v7.12电视端app
IBM CPLEX 12.10 学术版 mac操作系统安装包
ADC参数测试资料&matlab源程序
城市规划GIS技术应用指南_随书练习数据
其他资源
SiI9022A/SiI9024A Programmer's Reference(含寄存器定义,真正的编程手册)
计量经济学入门(黄少敏版)
基于Qt的局域网即时通信系统(聊天软件)
物联网项目-温湿度(网关开发+网页django+移动端android)
STM32使用移远NB-IOT模块BC95原理图
matlab基于SAD的区域立体匹配方法
J2EE外文文献(论文)
Delphi深度编程-FireDAC篇
S曲线加减速规划
ucosII 在51单片机上的移植代码
linux ftp服务器
单片机基础第三版李广第北京航空航天大学出版社
pulseaudio-1.1.zip
WinFi-1.0.18.0.exe
螺旋下刀计算器.exe
tilelive充电站-源码
素描阶段上午视频.mp4
cloisim:基于Unity-3D的多机器人模拟器可以通过SDF(仿真描述文件)轻松调出仿真环境。 它支持通过cloisim_ros连接ROS2-源码
半导体行业湿法刻蚀原理
织梦实现后台excel表格导入数据-十里.rar
电子技术基础_张瑞华
六子冲棋(博弈程序设计教程)(原创)源代码
基于SSH框架的WEB图书管理系统
开发者选项ROOT设置