This repository contains most of classic deep reinforcement learning algorithms, including - DQN, DDPG, A3C, PPO, TRPO. (More algorithms are still in progress)
2021-09-24 19:57:52 3.79MB Python开发-机器学习
1
多用户移动边缘计算的分散式计算分流:一种深度强化学习方法 多用户移动边缘计算的分散式计算分流:一种深度强化学习方法 这实现了论文中的算法 一些提示:尝试通过运行ipynb文件之一来开始您的旅程,例如test_save_model_multiple_t02_noBuf.ipynb。 “用于多用户移动边缘计算的分散式计算分流:一种深度强化学习方法” 如果您发现这对您的研究有用,请使用 @article {chen2018decentralized,title = {用于多用户移动边缘计算的分散式计算分流:一种深度强化学习方法},作者= {Chen,Zhao和Wang,Xiaodong},journal = {arXiv预印本arXiv:1812.07394},年= {2018}} 如有任何疑问,请通过与我联系。
2021-09-24 16:46:28 444.79MB JupyterNotebook
1
本教程展示了如何使用 MATLAB 附带的函数(即 Symbolic Math Toolbox 和 bvp4c)解决最优控制问题。 还实现了最速下降法来与 bvp4c 进行比较。 这些例子取自一些关于最优控制的经典书籍,涵盖了自由和固定终端时间的情况。 论文中强调了这些方法(例如 bvp4c)的缺陷和局限性,以帮助用户以更多的洞察力处理实际问题。
2021-09-23 19:33:04 1.12MB matlab
1
XPlane_ML_Reinforcement_Learning_Autopilot 该项目记录了用于飞行控制的强化学习环境的设置。 这将使每个用户/学习者/学生/飞行爱好者都可以拥有自己的RL算法,该算法可以在模拟环境中与飞机互动并进行实时控制。 使用的模拟器是X-Plane (飞行环境)。 这提供了一个可与参数一起使用的真实环境,以帮助使仿真尽可能接近实际情况。 Update: Use the leaderboard wiki Page--> ( ) to add details of your own scenario or (reinforcement learning) algorithm. GYM-XPLANE ENVIRONMENT INSTALLATION To install the gym x-palne environment go through the read me file of the folder : 这是实际Gym-xplane环境的最新版本。 其他文件夹包含用于其他功能的其他模块。 此类文件夹的名称将使您了解每个此类模块的功能。 阅读
2021-09-23 14:33:38 48.59MB agent algorithm simulation xplane
1
强化学习(reinforcement learning) 是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注。强化学习算法要解决的主要问题是,智能体如何直接与环境进⾏交互来学习策略。但是当状态空间维度增加时,传统的强化学习⽅法往往⾯面临着维度灾难,难以取得好的学习效果。分层强化学习(hierarchical reinforcement learning) 致力于将一个复杂的强化学习问题分解成几个子问题并分别解决,可以取得比直接解决整个问题更好的效果。分层强化学习是解决大规模强化学习问题的潜在途径,然而其受到的关注不高!本文将介绍和回顾分层强化学习的几大类方法。
1
强化学习在通信网络中的应用研究
2021-09-22 15:59:49 445KB 研究论文
1
研究了基于深度强化学习算法的自主式水下航行器(AUV)深度控制问题。区别于传统的控制算法,深度强化学习方法让航行器自主学习控制律,避免人工建立精确模型和设计控制律。采用深度确定性策略梯度方法设计了actor与critic两种神经网络。actor神经网络给出控制策略,critic神经网络用于评估该策略,AUV的深度控制可以通过训练这两个神经网络实现。在OpenAI Gym平台上仿真验证了算法的有效性。
1
强化学习
2021-09-20 22:08:53 3KB 强化学习 python
1
The twenty years since the publication of the first edition of this book have seen tremendous progress in artificial intelligence, propelled in large part by advances in machine learning, including advances in reinforcement learning. Although the impressive computational power that became available is responsible for some of these advances, new developments in theory and algorithms have been driving forces as well. In the face of this progress, a second edition of our 1998 book was long overdue, and we finally began the project in 2012. Our goal for the second edition was the same as our goal for the first: to provide a clear and simple account of the key ideas and algorithms of reinforcement learning that is accessible to readers in all the related disciplines. The edition remains an introduction, and we retain a focus on core, online learning algorithms. This edition includes some new topics that rose to importance over the intervening years, and we expanded coverage of topics that we now understand better. But we made no attempt to provide comprehensive coverage of the field, which has exploded in many di↵erent directions. We apologize for having to leave out all but a handful of these contributions.
2021-09-20 15:16:00 85.28MB reinforcemen 强化学习
1
线性倒立摆模型的时间最优控制,王铁军,张明廉,本文对线性倒立摆模型的时间最优控制进行了研究。对线性倒立摆模型进行约当标准型变换,使之后的直接状态转移公式变得简单。用相
2021-09-20 14:50:27 368KB 倒立摆 时间最优控制 约当标准型
1