超级马里奥兄弟的深度强化学习 描述 背景信息:超级马里奥兄弟(SMB)是一款流行的动作游戏,具有“真实的”环境和广阔的状态空间,是设计可玩计算机游戏的强化学习代理的理想平台。 该代理要求与世界上的各种对象和障碍进行交互,以鼓励采用知识丰富的学习方法。 方法-我们使用了OpenAI Gym提供的框架。 超级马里奥兄弟体育馆并从游戏环境中提取了信息,以使用PPO训练RL特工。 我们还向环境引入了预处理方法,例如帧缩放,随机跳帧,帧堆叠和噪声网,以提高代理的性能。 通过引入回滚操作来提高训练的稳定性,可以创建PPO的变体。 结果:该方法成功地训练了能够在20个小时的训练后完成水平的特工。 我们成功实现了一种方法,该方法可以比常规PPO实施更好地执行,在不应用数据预处理的情况下性能提高了50%,在应用数据预处理的情况下性能提高了10%。 工具 Pytorch已被用作主要的机器学习库 由于SMB
2022-11-09 22:52:04 18.11MB reinforcement-learning Python
1
这是强化学习基础知识--包含了完整体系梳理,以及四个关键部分: 价值学习 基本概念 策略学习 actor-critic算法 的基本概念及例子说明 欢迎下载
2022-11-09 12:22:43 2.76MB 强化学习
1
两段强化学习算法,提供给研究算法的同学。不知道有没有用
1
用winform做的界面,用C#编写的利用强化学习算法解决迷宫的问题
2022-11-05 17:32:18 69KB C# 强化学习 迷宫 winform
1
强化学习 dqn打砖块 参数文件,最高回报七十四分
2022-11-05 14:06:04 6.44MB 参数文件
1
用pytorch在Gym的游戏中实现Deep-Q-network深度强化学习,实时查看训练效果。 非常适合新手入门学习!!!
2022-11-04 15:05:55 242KB 强化学习
1
利用simulink中自带的深度强化学习包中的DQN算法优化
2022-11-04 12:04:49 567KB simulink 深度学习 强化学习
1
详细研究了深度Q-学习算法,它形成了深度Q网络(DQN)的基础这可能是当今强化学习中最具创新性的领域。这里将逐步介绍DQN,包括一些改变游戏规则的创新,如体验回放,以准确了解它们是如何帮助dqn在首次引入时实现世界一流的结果的。
2022-10-31 09:08:47 1.29MB 强化学习 机器学习 DQN
1
附有论文,交通信号灯识别源程序。采DDPG深度强化学习方法。给出了LOSS损失函数图像
1
PyTorch中的RAHGCN 1.概述 该存储库是PyTorch中通过强化学习(RAHGCN)实现的自适应双曲图卷积神经网络。 下游任务包括: 链接预测( lp ) 节点分类( nc ) 2.设定 2.1下载代码 首先从Github下载源代码。 git clone git@github.com:fuxingcheng/RHGNN.git" cd rahgcn 2.2启动虚拟环境 我们建议在虚拟环境中设置我们的项目。 您可以选择conda或virtualenv来创建和管理虚拟环境。 如果您尚未安装conda,请按照的说明进行安装。 如果尚未安装virtualenv,则只需运行pip3 install virtualenv 。 对于conda : conda env create -f environment.yml python=3.6 source activate ra
2022-10-26 21:08:44 6.5MB Python
1