搜索【深度强化】的结果

CS294_homework:我对伯克利的CS294（深度强化学习）家庭作业的解决方案

CS 294-112作业（2017年秋季提供）这是我为做作业的github（于2017年秋季提供）。我远程讲授了这门课程（使用讲义和视频），并实施了作业的编码部分。以下是我为每个作业分配的内容简介。免责声明：此代码仅用于教育目的。参加本课程当前迭代的学生应避免复制此代码，因为这会破坏学术诚信并妨碍他们自己的教育。依存关系 Gym 0.9.5用于作业3。请注意，在本课程中，其中一些依赖项尚未发布。此外，已修改了入门代码，以反映OpenAI Gym文档中的更改。作业1 到目前为止，该课程涵盖了更基本的监督学习。我实现了BC（行为克隆）和DAgger（数据集聚合），这（略有改善）了结果。我还尝试了各种超参数。作业2 我实现了策略梯度算法，并在各种环境下进行了一些测试。我玩了超参数，发现我的实现使代理的奖励收敛到理论值。我还实施了GAE（广义优势估算）并比

2022-05-14 14:23:19 2.08MB JupyterNotebook

1

人工智能-项目实践-强化学习-基于深度强化学习的原神自动钓鱼A

人工智能-项目实践-强化学习-基于深度强化学习的原神自动钓鱼A Introduction 现已支持不同分辨率屏幕原神自动钓鱼AI由YOLOX, DQN两部分模型组成。使用迁移学习，半监督学习进行训练。模型也包含一些使用opencv等传统数字图像处理方法实现的不可学习部分。其中YOLOX用于鱼的定位和类型的识别以及鱼竿落点的定位。DQN用于自适应控制钓鱼过程的点击，让力度落在最佳区域内。

2022-05-12 20:05:59 173KB 源码软件 强化学习 原神钓鱼

SLM Lab是PyTorch中的模块化深度强化学习框架-python

SLM Lab是PyTorch中的模块化深度强化学习框架 PyTorch 中的 SLM 实验室模块化深度强化学习框架。文档：https://slm-lab.gitbook.io/slm-lab/ BeamRider Breakout KungFuMaster MsPacman Pong Qbert Seaquest Sp.Invaders Ant HalfCheetah Hopper Humanoid Inv.DoublePendulum InvertedPendulum Reacher Walker

2022-05-12 16:43:05 411KB 机器学习

1

通过深度强化学习训练贪吃蛇,让其自动进行觅食避障行走+含代码操作演示视频

通过深度强化学习训练贪吃蛇,让其自动进行觅食避障行走+含代码操作演示视频运行注意事项：使用matlab2021a或者更高版本测试，运行里面的Runme.m文件，不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体可观看提供的操作录像视频跟着操作。

2022-05-12 09:11:52 213KB 综合资源 linux 运维 深度强化学习

基于深度强化学习的乒乓球游戏训练和测试仿真,实现机器人自动打乒乓球+含代码操作演示视频

基于深度强化学习的乒乓球游戏训练和测试仿真,实现机器人自动打乒乓球+含代码操作演示视频运行注意事项：使用matlab2021a或者更高版本测试，运行里面的Runme2.m文件，不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。注意，训练过程，较为漫长，需要电脑配置高点，然后耐心等待其训练。训练完成之后，运行runme2看其打乒乓球效果。具体可观看提供的操作录像视频跟着操作。

2022-05-11 09:11:49 1.67MB 游戏 文档资料 深度强化学习 乒乓球游戏

使用强化学习和深度强化学习算法来优化基于无人机的蜂窝网络以获得更高的吞吐量（python）(代码)

使用强化学习和深度强化学习算法来优化基于无人机的蜂窝网络以获得更高的吞吐量

2022-05-11 09:04:39 1.96MB 算法网络 python 开发语言

基于策略梯度的深度强化学习的机器人模型学习行走仿真+含代码操作演示视频

基于策略梯度的深度强化学习的机器人模型学习行走仿真+含代码操作演示视频运行注意事项：使用matlab2021a或者更高版本测试，运行里面的Runme.m文件，不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体可观看提供的操作录像视频跟着操作。

2022-05-09 19:17:55 921KB 学习 文档资料 策略梯度 深度强化学习

深度强化学习和贪婪搜寻算法的训练对比仿真

2022-05-07 09:11:20 12KB 算法 源码软件 深度强化学习

基于深度强化学习的MEC计算卸载与资源分配(python)

基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python) 基于深度强化学习的MEC计算卸载与资源分配(python)

2022-05-07 09:03:57 113KB python 源码软件 开发语言

一个比较简单的深度强化学习训练过程仿真,输出奖励值

2022-05-05 21:05:32 946B 文档资料 深度强化学习

个人信息

热门下载

最新下载

其他资源