搜索【深度强化学习】的结果

rl4j:JVM 的深度强化学习（Deep-Q，A3C）

RL4J：Java 强化学习有关 RL4J 的支持问题，请联系。 RL4J 是一个与 deeplearning4j 集成并在 Apache 2.0 开源许可下发布的强化学习框架。 DQN（带双 DQN 的深度 Q 学习）异步强化学习（A3C，异步 NStepQlearning）低维（信息数组）和高维（像素）输入。一篇有用的博客文章，向您介绍强化学习、DQN 和 Async RL：快速开始安装可视化厄运 Doom 还没有准备好，但如果你喜欢冒险，你可以通过一些额外的步骤让它工作：您将需要 vizdoom，编译本机库并将其移动到项目根目录中的文件夹中 export MAVEN_OPTS=-Djava.library.path=THEFOLDEROFTHELIB mvn compile exec:java -Dexec.mainClass="YOURMAINCL

2023-03-22 11:07:46 20.1MB reinforcement-learning artificial-intelligence doom dqn

1

reinforcement learning：an introduction代码

强化学习教父 Richard Sutton 的经典教材《Reinforcement Learning：An Introduction》第二版配套代码，本书分为三大部分，共十七章，对其简介和框架做了扼要介绍

2023-01-17 16:42:18 74KB 强化学习 深度强化学习 reinforcemen Reinforcemen

1

基于深度强化学习的软件定义卫星姿态控制算法.pdf

2022-12-17 07:49:15 582KB 基于深度强化学习的软件定义卫星姿

1

Human-level.ppt

通过解读论文《Human-level control through deep reinforcement learning》完成了PPT相关制作，用于科研汇报，发布到网上，方便大家查阅以及提出建议。

2022-12-14 12:22:09 1.17MB 深度强化学习 论文 PPT

1

基于深度强化学习的图片克隆生成

2022-12-13 11:30:03 5KB 图片克隆 验证码识别

基于深度强化学习自动炒股python实现

深度强化学习自动炒股选取 `1002` 只股票，进行训练，共计 - 盈利： `44.5%` - 不亏不赚： `46.5%` - 亏损：`9.0%`

2022-12-12 16:27:40 8KB 深度强化学习 自动炒股 机器学习

基于深度强化学习的德州扑克AI算法优化(有限注德扑简化版)

基于深度强化学习的德州扑克AI算法优化(有限注德扑简化版)，强化学习，在线学习，有限注德州扑克内含教程，胜率75%

2022-12-12 11:28:33 2.92MB 强化学习 德州扑克

基于深度强化学习的德州扑克AI算法优化(有限注德扑)

基于深度强化学习的德州扑克AI算法优化(有限注德扑) 强化学习，德州扑克，

2022-12-12 11:28:32 2MB 深度强化学习 德州扑克

基于深度强化学习的云工作流调度

基于深度强化学习的云工作流调度有向无环图，工作流，深度强化学习，图神经网络；蒙特卡洛树搜索

2022-12-12 11:28:31 7.03MB 深度强化学习 智能体 蒙特卡洛树搜索 图神经网络

使用深度强化学习的虚拟自动驾驶汽车-研究论文

在本文中，我们提出了一种深度强化学习方法，以评估虚拟创建的自动驾驶场景的性能。马尔可夫决策过程用于将车辆状态映射到动作。折扣和奖励功能也包含在决策策略中。为了处理导致强化学习的标准不稳定的高维度输入，我们使用了经验重播。为了进一步降低相关性，我们使用迭代更新来定期更新Q值。基于随机目标函数的亚当优化器与整流线性单元激活函数一起用作神经网络中的优化器，有助于进一步优化过程。这款自动驾驶汽车不需要任何带有标签的训练数据即可学习人类的驾驶行为。受现实情况启发，基于动作的奖励功能用于训练车辆。在我们的方法中已经证明，经过多次迭代，虚拟制造的车辆会产生无碰撞运动，并执行与人类相同的驾驶行为。

2022-12-09 15:58:08 558KB Reinforcement learning; Markov decision

1

个人信息

热门下载

最新下载

其他资源