搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

qtrader:资产组合管理的强化学习-源码

qtrader 资产组合管理的强化学习为什么要进行强化学习？学习最佳行动，而不是为市场建模。由于其在线培训，因此可以适应市场的暂时变化。优化长期（累积）回报，而不是瞬时收益。设置由于typing s，因此与Python 3兼容苹果系统 source scripts/setup.sh 文献资料： qtrader简介：现有方法的动机，利弊：相关资源清单：硕士论文：15分钟的项目演讲

2022-03-03 00:26:30 18.03MB python reinforcement-learning q-learning recurrent-neural-networks

1

【无人机路径规划】基于强化学习实现多无人机路径规划附matlab代码.zip

智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、路径规划、无人机等多种领域的Matlab仿真代码

2022-03-02 17:18:55 888KB

1

Reinforcement learning state of the art

强化学习经典书籍，介绍了强化学习当前的各个细节，实用性很强。

2022-03-02 08:44:10 8.27MB 强化学习 经典书籍

1

Q-learning:使用基于Q学习的强化学习技术预测量化网格中的最短路径-源码

Q学习使用基于Q学习的强化学习技术预测量化网格中的最短路径该程序可用于预测有限量化网格中的最短路径。活动区域以“绿色”突出显示，而限制区域以“黑色”突出显示。起点用“黄色”突出显示，终点用“红色”突出显示。 RL代理的当前位置由“蓝色”颜色表示，而预测路径在右侧剪辑上以“海军蓝色”颜色绘制。允许RL代理随机移动并探索可移动区域以填充Q矩阵。 RL代理到达目的地后，将根据R-Matrix提供奖励。然后，RL代理从新的随机点重新开始搜索，在此它再次寻找到达目的地点的随机路径。经过一些迭代后，预测路径（右侧）似乎收敛了，并且短路了可能的路径。（注意：所有对角线移动和笔直移动均具有相等的权重）编译 g ++ qlearn.cpp -o main`pkg-config --cflags --libs opencv` -std = c ++ 11 用法 ./main arenaWi

2022-03-02 07:55:42 130KB C++

1

Python 强化学习 DQN Flappy Bird

Playing Flappy Bird Using Deep Reinforcement Learning (Based on Deep Q Learning DQN)

2022-03-01 20:37:09 12.23MB 强化学习 DQN Flappy Bird

1

Reinforcement Learning An introduction

Richard S. Sutton的关于强化学习经典的教科书，此书为2017最新版，涵盖DeepMind团队最新理论成果，无论是想学习强化学习还是作为机器学习的泛读材料，都值得一看。

2022-02-27 21:55:14 10.85MB 强化学习

1

各种阈值函数

里面含有多种阈值函数，如软、硬阈值函数

2022-02-27 15:07:06 992B 阈值函数

1

基于分形插值函数的分形插值曲面的变差与计盒维数木 (2012年)

分形插值是拟合数据的一种新方法，它可以反映出曲线和曲面上的粗糙性质．本文介绍了基于仿射分形插值函数的分形插值曲面的构造方法，给出了连续函数中心变差的概念，讨论了中心变差与变差、中心变差与计盒维数之间的关系．研究了这类分形插值曲面所对应的二元连续函数中心变差的性质，并根据二元连续函数中心变差与函数图像计盒维数之间的关系，得到了这类分形插值曲面的计盒维数．

2022-02-27 10:31:54 257KB 自然科学 论文

1

深度强化学习 ( DQN )基本原理与AI项目实战教学视频代码资料

强化学习是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论，即有机体如何在环境给予的奖励或惩罚的刺激下，逐步形成对刺激的预期，产生能获得最大利益的习惯性行为。在强化学习的世界里，算法称之为Agent，它与环境发生交互，Agent从环境中获取状态（state），并决定自己要做出的动作（action）.环境会根据自身的逻辑给Agent予以奖励（reward）。奖励有正向和反向之分。比如在游戏中，每击中一个敌人就是正向的奖励，掉血或者游戏结束就是反向的奖励。课程内容】强化学习简介强化学习基本概念马尔科夫决策过程 Bellman方程值迭代求解代码实战求解过程 QLearning基本原理 QLearning迭代计算实例 QLearning迭代效果求解流程详解 DeepQnetwork原理 DQN网络细节 DQN网络参数配置搭建DQN网络模型 DQN卷积操作定义数据预处理实验阶段数据存储实现训练模块 Debug解读训练代码完整代码流程分析 DQN效果演示

2022-02-24 11:29:29 948B 深度强化学习 强化学习 AI 深度学习

1

强化学习：在60天内学习深度强化学习！ Python讲座和代码。强化学习+深度学习-源码

深度强化学习课程探索神经网络和强化学习的结合。 Python和PyTorch中的算法和示例您是否听说过和的取得了惊人的结果？这都是关于深度神经网络和强化学习的。您是否想了解更多？这是您最终学习Deep RL并将其用于新的令人兴奋的项目和应用程序的正确机会。在这里，您将找到这些算法的深入介绍。您将学习q学习，q学习，PPO，演员评论家，并使用Python和PyTorch实施它们。最终目的是使用这些通用技术并将其应用于各种重要的现实世界问题。德米斯·哈萨比斯（Demis Hassabis）该存储库包含：主要来自DeepMind和Berkley Youtube的频道的讲

2022-02-24 09:28:48 7.35MB machine-learning reinforcement-learning qlearning deep-learning

1

个人信息

热门下载

最新下载

其他资源