Reinforcement Learning Toolbox User's Guide_R2021a.pdf
2021-08-03 09:50:18 6.44MB Matlab
1
Reinforcement Learning-Theory and Algorithms_2020.pdf
2021-08-01 15:55:54 952KB reinforcement learning
1
基于深度学习和强化学习的量化交易系统(基于深度学习和强化学习的定量交易系统) (中文版本在英文版本的下面,请拖动查看) 大纲: 主要结构 仍在努力 结论 主要结构: 该系统包括: 数据处理模块 价格预测模块 强化学习模块基于: 6个动作的设计(卖出,卖空,卖出持有,卖空,卖出,覆盖) 强化学习模块基于: 使用VWAP或BBIBOLL的上下线将价格转换为(-1,1) 分别设计两个增强学习模型,分别用于(买入,卖出持有)和(卖空,覆盖,持有) 设置两个模型的优先级,并决定应输出哪个操作 基于价格预测和RL收益的库存拣货策略 数据处理模块 我从Kaggle获得了数据集,该数据集是美国股票市场的每日价格和数量数据。 数据集包括开盘价,收盘价,高价,低价和数量。 但是,这种数据在深度学习和强化学习的训练中效果不佳。 因此,我创建了数十个技术分析功能以为输入生成更多功能。 通过这种方式
1
佛罗里达大学电子与计算机工程系教授Sean Meyn撰写的新书稿《强化学习与控制系统》,重点讲述了与强化学习最相关的控制基础,以及基于这些基础的RL算法设计的大量工具。
2021-07-19 15:07:41 17.08MB 控制系统 强化学习
1
总共178篇,基本涵盖了20年NIps上所有与强化学习相关的文章。 zip压缩包,不要解压密码,261M大小。 看一看顶会论文怎么写的,自己下笔也大概能有个章法,Good Luck! 勤奋决定天分!
2021-07-14 13:18:15 261.61MB 强化学习RL reinforcement learning NIPS2020
1
Can You Train a Dog to Sit? If so, You Can Master Reinforcement Learning in No time! Welcome to the world of reinforced learning. This is a world where self-driving cars can be seen on real roads, where programs can beat world champions, where robots are not only a part of futuristic movies. Sound too scientifically involved for your expertise? Don?t worry; reinforcement learning is much more straightforward than you think. You do not need a college degree or to be a world-class developer in order to build a reinforcement learning application. Some rudimentary Python programming skills and a basic knowledge of Machine Learning is all it takes for this book to turn you into an RL expert. By describing the concept of reinforcement learning in a simple, non-technical way, teaching you its elements, applications, and algorithms in the most comprehensive way possible while giving you a great jumping-off point with some amazing Python implementations, this book is a definite must-have for everyone who wants to master this popular branch of AI without drowning in the technical nonsense. Inside this Book You?ll Discover: The elements of reinforcement learning Reiniforcement Learning vs. other learning types Simulated evironments and Policies A guide to Markov Decision Processes Dynamic Programming An exploration of Monte Carlo Methods The secrets to Q Learning And much, much more! If this sounds like a good deal to you, read this book and become a Reinforcement Learning expert in a matter of days.
2021-07-14 11:49:05 28.77MB 强化学习 人工智能 机器学习
1
LearningRacer-rl 概述 该软件能够在几分钟内通过深度强化学习来自我学习您的AI Robocar。 您可以使用Real Robocar和DonkeySim。 1.说明 许多DIY自驾车,例如JetBot或JetRacer,DonkeyCar,都通过监督学习来使用行为克隆。 该方法需要通过人工演示收集很多标记的数据。 在这种情况下,人类驾驶技术非常重要。 另一方面,在此软件中使用深度强化学习(DRL)。 通过与环境的交互,可以自动获得运行行为。 不需要人类标签的样本数据。 另外,该软件代理可以在Jetson Nano上运行。 为什么可以在Jetson Nano上运行并且学习时间短? 因为使用了SAC(软演员评论家)和VAE的集成。 SAC是最新的政策外强化学习方法。 另外,VAE预先在云服务器上作为SAC的CNN层进行训练。(这种方法称为状态表示学习)。 此方法由An
2021-07-13 11:32:16 17.25MB deep-reinforcement-learning sac jetbot jetson-nano
1
阀门控制的强化学习 版本2.1。 2021年3月10日:改进了文档,为希望将代码适应自己的工厂系统的新开发人员提供 Elsevier的MLWA(机器学习与应用程序)期刊的文档记录 该项目将DDPG用于非线性阀的“最佳”控制。 使用MATLAB R2019a和Simulink。 本文介绍了使用MATLAB的强化学习工具箱为非线性设备(例如阀门)创建“最佳”控制器的方法。 “分级学习”是一种简单的“指导”方法,它使人们可以更有效地训练代理。 该论文对研究过程中的学习进行了高度整理,并将观察结果与以前发表的文献相联系,以解决在使用DDPG和强化学习进行最佳控制时经常遇到的挑战。 虽然代码和纸张将Valve用作“工厂”,但这些方法和代码很容易适用于任何工业工厂。 请注意-分级学习是课程学习的最简单形式(以及面向应用/实践的形式)。 文档分为三个部分: 如何按原样运行MATLAB代码和Sim
2021-07-11 11:18:05 5.88MB MATLAB
1
Manning.Grokking.Deep.Reinforcement.Learning.无水印版pdf
2021-07-08 09:09:33 72.5MB computerscience artificial neural network
1