思维导图根据王树森老师课件整理。 主要包括: 强化学习基本概念 基本方法(Value-Based、Policy-Based、Actor-Critic) 策略学习(Reinforce with baseline、A2C) 价值学习(Sarsa、Q-Learning(DQN)) 连续动作控制(DPG、DDPG) 包含上述各种基本算法的原理及公式推导
2022-05-16 11:05:40 24MB 机器学习 深度学习 强化学习
1
play-daxigua-using-Re强化学习:使用强化学习DQN算法,训练AI模型来玩合成大西瓜游戏,提供Keras版本和PARL(paddle)版本
2022-05-15 19:08:37 4KB
1
这是几篇最新中文深度强化学习综述。综述了深度强化学习的发展历程, 兼论计算机围棋的历史, 阐述了3类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势。本文是中文深度强化学习综述,更利于入门学习者理解。
2022-05-15 18:59:29 3.77MB 深度强化学习
1
《基于强化学习的电商搜索排序算法及在京东的实践.pdf》
2022-05-14 19:06:50 147.41MB 排序算法 算法 搜索算法 推荐算法
CS 294-112作业(2017年秋季提供) 这是我为做作业的github(于2017年秋季提供)。 我远程讲授了这门课程(使用讲义和视频),并实施了作业的编码部分。 以下是我为每个作业分配的内容简介。 免责声明:此代码仅用于教育目的。 参加本课程当前迭代的学生应避免复制此代码,因为这会破坏学术诚信并妨碍他们自己的教育。 依存关系 Gym 0.9.5用于作业3。 请注意,在本课程中,其中一些依赖项尚未发布。 此外,已修改了入门代码,以反映OpenAI Gym文档中的更改。 作业1 到目前为止,该课程涵盖了更基本的监督学习。 我实现了BC(行为克隆)和DAgger(数据集聚合),这(略有改善)了结果。 我还尝试了各种超参数。 作业2 我实现了策略梯度算法,并在各种环境下进行了一些测试。 我玩了超参数,发现我的实现使代理的奖励收敛到理论值。 我还实施了GAE(广义优势估算)并比
2022-05-14 14:23:19 2.08MB JupyterNotebook
1
人工智能-项目实践-强化学习-基于深度强化学习的原神自动钓鱼A Introduction 现已支持不同分辨率屏幕 原神自动钓鱼AI由YOLOX, DQN两部分模型组成。使用迁移学习,半监督学习进行训练。 模型也包含一些使用opencv等传统数字图像处理方法实现的不可学习部分。 其中YOLOX用于鱼的定位和类型的识别以及鱼竿落点的定位。DQN用于自适应控制钓鱼过程的点击,让力度落在最佳区域内。
2022-05-12 20:05:59 173KB 源码软件 强化学习 原神 钓鱼
SLM Lab是PyTorch中的模块化深度强化学习框架 PyTorch 中的 SLM 实验室模块化深度强化学习框架。 文档:https://slm-lab.gitbook.io/slm-lab/ BeamRider Breakout KungFuMaster MsPacman Pong Qbert Seaquest Sp.Invaders Ant HalfCheetah Hopper Humanoid Inv.DoublePendulum InvertedPendulum Reacher Walker
2022-05-12 16:43:05 411KB 机器学习
1
使用Python和Keras进行深度学习/强化学习股票投资-定量投资和算法交易的前沿解决方案简介(修订版) 强化学习是一种很好的应用于股票数据学习的自学习机器学习技术。 本书介绍了如何使用Python进行基于强化学习的股票投资模拟程序的开发。 为此,我在理论和代码级别上添加了详细的说明。 通过本书,您将能够理解深度学习和强化学习,并将其用于包括股票投资在内的多个领域。 购买链接 本书涵盖的内容 深度学习与强化学习理论 如何将强化学习应用于股票投资 基于强化学习的股票投资系统开发 采集和处理实际库存数据以进行强化学习 如何通过强化学习来学习库存数据 如何使用学习型强化学习模型 如何基于强化学习定制股票投资系统 首选项 pip install tensorflow==1.15.2 pip install plaidml-keras==0.6.2 pip install mplfinan
2022-05-12 16:25:26 2.31MB Python
1
通过深度强化学习训练贪吃蛇,让其自动进行觅食避障行走+含代码操作演示视频 运行注意事项:使用matlab2021a或者更高版本测试,运行里面的Runme.m文件,不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。 具体可观看提供的操作录像视频跟着操作。
2022-05-12 09:11:52 213KB 综合资源 linux 运维 深度强化学习
基于深度强化学习的乒乓球游戏训练和测试仿真,实现机器人自动打乒乓球+含代码操作演示视频 运行注意事项:使用matlab2021a或者更高版本测试,运行里面的Runme2.m文件,不要直接运行子函数文件。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。 注意,训练过程,较为漫长,需要电脑配置高点,然后耐心等待其训练。训练完成之后,运行runme2看其打乒乓球效果。 具体可观看提供的操作录像视频跟着操作。