只为小站
首页
域名查询
文件下载
登录
(2024.7可用)自动抢北邮本部羽毛球场,体育馆,健身房(已实现)脚本,bupt_bupt-
gym
.zip
(2024.7可用)自动抢北邮本部羽毛球场,体育馆,健身房(已实现)脚本,bupt_bupt-
gym
2024-12-19 23:28:08
8.11MB
1
Isaac
Gym
环境安装包
Isaac
Gym
环境安装包
2024-06-06 15:54:01
64.09MB
1
Lunar_project:
Gym
.openai.comenvsLunarLander-v2的解决方案
Lunar_project
gym
.openai.com/envs/LunarLander-v2的解决方案 演示开始 pip install
gym
pip install box2d pip install tensorflow pip install keras git clone https://github.com/sunny3/Lunar_project cd Lunar_project python demonstration.py examples.py默认运行一个13集的长内存模型。 如果要切换到短短的2集,则应运行 python demonstration.py --mode short 在笔记本电脑的木星文件中介绍了使用代理类和详细注释训练网络(内存不足)的过程,还提供了图形和启动1集动画的功能 所有基本课程注释也都显示在木星笔记本文件中
2023-02-21 16:00:20
178KB
JupyterNotebook
1
Deep-Reinforcement-Learning-With-Python:使用OpenAI
Gym
和TensorFlow结合广泛的数学知识来掌握经典RL,深度RL,分布式RL,逆RL等
使用OpenAI
Gym
和TensorFlow结合广泛的数学知识来掌握经典RL,深度RL,分布式RL,逆RL等 关于这本书 近年来,随着算法质量和数量的显着提高,《 Python上的动手强化学习》第二版已完全改编为示例丰富的指南,用于学习最新的强化学习(RL)和使用TensorFlow和OpenAI
Gym
工具包的深度RL算法。 除了探索RL基础知识和基本概念(例如Bellman方程,Markov决策过程和动态规划)之外,第二版还深入探讨了基于价值,基于策略和批评演员的RL方法的全过程,并提供了详细的数学知识。 它深入探索了最新的算法,例如DQN,TRPO,PPO和ACKTR,DDPG,TD3和SAC,从而使基础数学神秘化并通过简单的代码示例演示了实现。 本书有几章专门介绍新的RL技术,包括分布式RL,模仿学习,逆RL和元RL。 您将学习如何利用OpenAI基准库的改进“稳定基准”轻
2023-02-19 12:24:45
24.65MB
reinforcement-learning
deep-learning
deep-reinforcement-learning
openai-gym
1
rex-
gym
:适用于开源四足机器人(SpotMicro)的OpenAI
Gym
环境
Rex:一个开源的四足机器人 该项目的目标是训练一个开源3D打印四足机器人,探索Reinforcement Learning和OpenAI
Gym
。 目的是让机器人学习模拟中的家务和一般任务,然后在不进行任何其他手动调整的情况下,在真实机器人上成功地传递知识( Control Policies )。 该项目的主要灵感来自波士顿动力公司所做的令人难以置信的工作。 相关资料库 一个CLI应用程序,用于引导和控制Rex运行经过训练的Control Policies 。 cloud-用于在云上训练Rex的CLI应用程序。 Rex-
Gym
:OpenAI
Gym
环境和工具 该存储库包含用于训练Rex的OpenAI
Gym
Environments集合,Rex URDF模型,学习代理实现(PPO)和一些脚本,以开始训练课程并可视化学习到的Control Polices 。 此CLI应用程序允许批量培训,策略重现和单个培训呈现的会话。 安装 创建一个Python 3.7虚拟环境,例如使用Anaconda conda create -n rex python=3.7 anaconda cond
2023-01-14 16:48:56
117.44MB
machine-learning
reinforcement-learning
robot
robotics
1
gym
-usv:无人水面飞行器的OpenAI健身环境
健身房 训练USV导航的环境。 安装 cd
gym
-usv pip install -e . 关于:A. Gonzalez-Garcia和H.Castañeda,“无人水面车辆的建模,识别和控制”,AUVSI XPONENTIAL 2019:万物无人,2019。 上的路径跟踪控制:A.冈萨雷斯-加西亚,H卡斯塔涅达和L.加里多,“USV路径跟踪基于控制的深强化学习和自适应控制,”全球海洋2020,2020。
2022-12-07 19:02:41
39KB
Python
1
gym
-battleship:战舰环境,用于强化学习任务
健身搏击 使用OpenAI环境工具包的战舰环境。 基本 制作并初始化环境: import
gym
import
gym
_battleship env =
gym
.make('battleship-v0') env.reset() 获取动作空间和观察空间: ACTION_SPACE = env.action_space.n OBSERVATION_SPACE = env.observation_space.shape[0] 运行一个随机代理: for i in range(10): env.step(env.action_space.sample()) 观察隐藏的游戏状态: print(env.board_generated) 有效动作 有两种输入动作的方法。 第一种方法是按原样输入元组: env =
gym
.make('battleship-v0') env.reset(
2022-11-15 09:09:35
279KB
environment
reinforcement-learning
openai-gym
openai
1
2048-
Gym
:该项目旨在使用强化学习算法来玩2048游戏
2048健身房 该存储库是一个有关使用DQN(Q-Learning)玩2048游戏并使用加速和加速环境的。使用的算法来自“ ,环境是自定义的 env。该环境包含两种类型的电路板表示形式:二进制和无二进制。第一个使用幂二矩阵来表示电路板的每个图块。相反,没有二进制文件使用原始矩阵板。 该模型使用两种不同类型的神经网络:CNN(卷积神经网络),MLP(多层感知器)。使用CNN作为特征提取器比使用MLP更好。可能是因为CNN可以提取空间特征。结果,代理在1000个已玩游戏的10%中获得2048个图块。 奥图纳 Optuna是一个自动超参数优化软件框架,专门为机器学习而设计。它具有命令式,按运行定义样式的用户API。多亏了我们的运行定义API,用Optuna编写的代码具有高度的模块化,并且Optuna的用户可以动态构造超参数的搜索空间。 还有就是如何使用这个库指南。 Numba 是一种开源JI
2022-11-10 11:29:52
57.31MB
machine-learning
reinforcement-learning
openai-gym
artificial-intelligence
1
在
Gym
的游戏中实现Deep-Q-network深度强化学习(pytorch)
用pytorch在
Gym
的游戏中实现Deep-Q-network深度强化学习,实时查看训练效果。 非常适合新手入门学习!!!
2022-11-04 15:05:55
242KB
强化学习
1
ddpg-ai
gym
:具有深度强化学习的连续控制-在OpenAI
Gym
环境中实现的深度确定性策略梯度(DDPG)算法
ddpg-ai
gym
深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lillicrap等人 。) 如何使用 git clone https://github.com/stevenpjg/ddpg-ai
gym
.git cd ddpg-ai
gym
python main.py 培训期间 一旦训练 学习曲线 InvertedPendulum-v1环境的学习曲线。 依存关系 Tensorflow(在tensorflow版本0.11.0rc0 ) OpenAi体育馆 Mujoco 产品特点 批量归一化(提高学习速度) 梯度转换器(在arXiv中提供: ) 注意 使用不同
2022-06-10 08:26:41
322KB
reinforcement-learning
deep-learning
tensorflow
TensorflowPython
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于MQ2烟雾传感器的STM32F103程序
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
simulink仿真实现光伏发电MPPT+能量管理
校园网规划与设计和pkt文件
RX560 bios合集(请务必注意显存品牌和大小以及是否需要6pin!)含刷新工具.zip
python实现的学生信息管理系统—GUI界面版
IEEE ENDNOTE 模板【更新】
科研伦理与学术规范 期末考试2 (40题).pdf
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
Autojs 例子 源码 1600多个教程源码
鲸鱼优化算法 WOA matlab源代码(详细注释)
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
基于Matlab的PI/4 DQPSK的调制解调源代吗
最新下载
Plex v7.12电视端app
IBM CPLEX 12.10 学术版 mac操作系统安装包
ADC参数测试资料&matlab源程序
城市规划GIS技术应用指南_随书练习数据
支付宝低保真原型作业.rp
数理统计(第二版)赵选民,徐伟等
python爬虫数据可视化分析大作业带文档
支付宝App低保真原型设计(课后答案).rp
《AxureRP9网站与App原型设计》教学教案-10支付宝App低保真原型设计.docx
支付宝原型设计低保真-Axure9.zip
其他资源
经典无监督特征选择算法LaplacianScore算法matlab代码
libjpeg.so.62
CnPlugin_1.5.1
计算机408 之数据结构 考研真题1800题集锦
matlab离散数据分析
java sip demo
用友 NC6.5 数据字典
不刷root权限修改系统时间
蓝天P770DM bios
新建文本文档.txt
面向内涵式发展的操作系统课程建设_谭舜泉.pdf
javaweb宾馆管理系统
opencvjs编译后的文件
基于spring mvc、spring、hibernate、bootstrap 的网上商城源码下载
eqxue-v1.0.1-install.zip
黑莓8320_4.5.182_精简ROM一键刷机包.exe
NumberDriveParser:NumberDrive项目的表达式解析器
ffmpeg+libx264.rar
LQFP32 44 64 LQFP128封装Altium Designer AD PCB封装库2D3D元件库文件.zip
红外解码程序 实际项目中使用的红外解码程序,实际编译测试可以说是最精简的,有详细的注解。程序总长为15行。
自己编写ping程序
matlab 2007b注册机
一种新能源电动汽车的一键启动系统
java游戏详解,包括贪吃蛇等几十个游戏开发过程