Franois-Lavet et la. An Introduction to Deep Reinforcement Learning. Foundations and trends in machine learning, 2018.
2021-08-26 14:12:03 2.46MB reinforcement learning deep learning
1
LearningRacer-rl 概述 该软件能够在几分钟内通过深度强化学习来自我学习您的AI Robocar。 您可以使用Real Robocar和DonkeySim。 1.说明 许多DIY自驾车,例如JetBot或JetRacer,DonkeyCar,都通过监督学习来使用行为克隆。 该方法需要通过人工演示收集很多标记的数据。 在这种情况下,人类驾驶技术非常重要。 另一方面,在此软件中使用深度强化学习(DRL)。 通过与环境的交互,可以自动获得运行行为。 不需要人类标签的样本数据。 另外,该软件代理可以在Jetson Nano上运行。 为什么可以在Jetson Nano上运行并且学习时间短? 因为使用了SAC(软演员评论家)和VAE的集成。 SAC是最新的政策外强化学习方法。 另外,VAE预先在云服务器上作为SAC的CNN层进行训练。(这种方法称为状态表示学习)。 此方法由An
2021-07-13 11:32:16 17.25MB deep-reinforcement-learning sac jetbot jetson-nano
1
Manning.Grokking.Deep.Reinforcement.Learning.无水印版pdf
2021-07-08 09:09:33 72.5MB computerscience artificial neural network
1
彩虹 Rainbow:结合深度强化学习的改进 。 结果和预先训练的模型可以在找到。 DQN Double DQN 优先体验重播 决斗网络体系结构 多步骤退货 分布式RL 吵网 使用默认参数运行原始Rainbow: python main.py 可以使用以下选项运行数据有效的Rainbow (请注意,实际上,此处通过手动设置内存容量与最大时间步数相同来实现“无界”内存): python main.py --target-update 2000 \ --T-max 100000 \ --learn-star
1
自动股票交易的深度强化学习:整体策略 该存储库提供了代码 的Jupiter Notebook重新实现了这种整体策略。 抽象的 股票交易策略在投资中起着至关重要的作用。 但是,在复杂而动态的股票市场中设计一种有利可图的战略是具有挑战性的。 在本文中,我们提出了一种深度集成强化学习方案,该方案可以通过最大化投资回报来自动学习股票交易策略。 我们训练一种深度强化学习代理,并使用三种基于行为者批评的算法来获得整体交易策略:近距离策略优化(PPO),优势参与者批评者(A2C)和深度确定性策略梯度(DDPG)。 集成策略继承并集成了三种算法的最佳功能,从而可以稳健地适应不同的市场条件。 为了避免在具有连续动作空间的训练网络中消耗大量内存,我们采用按需加载方法来处理非常大的数据。 我们在30支具有足够流动性的道琼斯股票上测试了我们的算法。 评估了具有不同强化学习算法的交易代理商的表现,并与道琼斯工业平均
1
DQ深度学习Deep Reinforcement Learning with Double Q-Learning.pdf
2021-06-22 18:06:00 1.14MB 深度学习
1
俄罗斯方块 使用深度强化学习的机器人。 演示版 经过一些训练后,首先获得10000分。 它是如何工作的 强化学习 首先,代理将进行随机移动,将状态和给定的奖励保存在有限的队列(重播内存)中。 在每个情节(游戏)结束时,代理将使用重播内存的随机样本来训练自己(使用神经网络)。 随着玩越来越多的游戏,代理变得越来越聪明,得分越来越高。 由于在强化学习中,一旦特工发现了良好的“路径”,它就会坚持下去,因此它也被视为探索变量(随时间而减小),因此特工有时会选择一种随机动作,而不是它认为最佳的动作。 。 这样,它可以发现新的“路径”以获得更高的分数。 训练 培训基于。 相反,只使用所获得的当前状态,并奖励对网络进行训练的,它是用来Q学习(即认为从当前状态到未来的一个过渡),以找出什么是考虑到所有给定状态的最佳成绩未来的回报,即算法不是贪婪的。 这使代理可以采取一些可能无法立即获得回报的举动,因此以
1
文献翻译,格式做的比较认真,公式图片都做了翻译,格式符合规范。适用于作业,课设,毕设文献翻译
2021-06-11 13:10:43 696KB 翻译 DQN 深度学习 强化学习
1
状态:活动(在活动开发中,可能会发生重大更改) 该存储库将实现经典且最新的深度强化学习算法。 该存储库的目的是为人们提供清晰的pytorch代码,以供他们学习深度强化学习算法。 将来,将添加更多最先进的算法,并且还将保留现有代码。 要求 python <= 3.6 张量板 体育馆> = 0.10 火炬> = 0.4 请注意,tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败: 安装健身房 pip install gym 安装pytorch please go to official webisite to install it: https://pytorch.org/ Recommend use Anaconda Virtual Environment to manage your packages 安装tensorboardX pip install tensorboardX pip install tensorflow==1.12 测试 cd Char10\ TD3/ python TD3
1
This practical guide will teach you how deep learning (DL) can be used to solve complex real-world problems.
2021-05-16 22:23:10 7.22MB Deep Learning Reinforcement le
1