算法股票交易已经成为当今金融市场的一种主要交易方式,大多数交易现在已经完全自动化。深度强化学习(DRL)代理被证明是一种力量,在许多复杂的游戏,如国际象棋和围棋不可忽视。本文将股票市场的历史价格序列和走势看作是一个复杂的、不完全的信息环境,在这个信息环境中,本文试图实现收益最大化和风险最小化。
2021-07-09 12:06:59 1.5MB 强化学习
1
深度强化学习课程的高清课间资源,对于学习深度学习以及强化学习理论的研究人士很有帮助
2021-07-07 10:18:39 159.03MB 深度学习 强化学习
1
彩虹 Rainbow:结合深度强化学习的改进 。 结果和预先训练的模型可以在找到。 DQN Double DQN 优先体验重播 决斗网络体系结构 多步骤退货 分布式RL 吵网 使用默认参数运行原始Rainbow: python main.py 可以使用以下选项运行数据有效的Rainbow (请注意,实际上,此处通过手动设置内存容量与最大时间步数相同来实现“无界”内存): python main.py --target-update 2000 \ --T-max 100000 \ --learn-star
1
自动股票交易的深度强化学习:整体策略 该存储库提供了代码 的Jupiter Notebook重新实现了这种整体策略。 抽象的 股票交易策略在投资中起着至关重要的作用。 但是,在复杂而动态的股票市场中设计一种有利可图的战略是具有挑战性的。 在本文中,我们提出了一种深度集成强化学习方案,该方案可以通过最大化投资回报来自动学习股票交易策略。 我们训练一种深度强化学习代理,并使用三种基于行为者批评的算法来获得整体交易策略:近距离策略优化(PPO),优势参与者批评者(A2C)和深度确定性策略梯度(DDPG)。 集成策略继承并集成了三种算法的最佳功能,从而可以稳健地适应不同的市场条件。 为了避免在具有连续动作空间的训练网络中消耗大量内存,我们采用按需加载方法来处理非常大的数据。 我们在30支具有足够流动性的道琼斯股票上测试了我们的算法。 评估了具有不同强化学习算法的交易代理商的表现,并与道琼斯工业平均
1
近年来,人工智能技术已被应用于无线通信领域,以解决传统无线通信技术面对信息爆炸和万物互联等新发展趋势所遇到的瓶颈问题。首先介绍深度学习、深度强化学习和联邦学习三类具有代表性的人工智能技术;然后通过对这三类技术在无线通信中的无线传输、频谱管理、资源配置、网络接入、网络及系统优化5个方面的应用进行综述,分析和总结它们在解决无线通信问题时的原理、适用性、设计方法和优缺点;最后围绕存在的局限性指出智能无线通信技术的未来发展趋势和研究方向,期望为无线通信领域的后续研究提供帮助和参考。
1
基于深度强化学习的动态计算卸载,程百川,刘丹谱,移动边缘计算在移动网络边缘提供计算资源。为了减少执行时延,计算密集型任务可以从用户设备卸载到移动边缘服务器。当考虑到任务
2021-06-21 09:50:46 320KB 无线通信
1
俄罗斯方块 使用深度强化学习的机器人。 演示版 经过一些训练后,首先获得10000分。 它是如何工作的 强化学习 首先,代理将进行随机移动,将状态和给定的奖励保存在有限的队列(重播内存)中。 在每个情节(游戏)结束时,代理将使用重播内存的随机样本来训练自己(使用神经网络)。 随着玩越来越多的游戏,代理变得越来越聪明,得分越来越高。 由于在强化学习中,一旦特工发现了良好的“路径”,它就会坚持下去,因此它也被视为探索变量(随时间而减小),因此特工有时会选择一种随机动作,而不是它认为最佳的动作。 。 这样,它可以发现新的“路径”以获得更高的分数。 训练 培训基于。 相反,只使用所获得的当前状态,并奖励对网络进行训练的,它是用来Q学习(即认为从当前状态到未来的一个过渡),以找出什么是考虑到所有给定状态的最佳成绩未来的回报,即算法不是贪婪的。 这使代理可以采取一些可能无法立即获得回报的举动,因此以
1
导弹模型matlab代码学习指南:基于深度元学习和模型预测路径积分控制的制导律 关于 这项工作的目的是利用本文所述的导弹制导问题,利用模型预测路径积分控制器实施基于模型的深度强化学习,该IEEE Access论文位于arXiv上,并且在arXiv上也可用。 依存关系 此代码已经在python上进行了测试,并且需要安装tensorflow-gpu和numpy。 该演示运行建立在预先训练的指导神经网络模型的基础上,如果有人提出要求,其代码,系统模型和训练数据集将在之后发布。 怎么跑 请使用mppi_run.py运行。 也可以使用monte_carlo_simu.sh进行迭代运行以获取蒙特卡洛采样结果。 在本文中,使用MATLAB的get_Monte.m文件收集了蒙特卡洛模拟的结果。 引用 如果您发现我们的作品对您的研究有用,请考虑引用: @article{liang2019learning, title={Learning to Guide: Guidance Law Based on Deep Meta-Learning and Model Predictive Path Integra
2021-06-12 22:18:44 13.91MB 系统开源
1
基于深度强化学习的无人驾驶车道保持决策的研究_方川.caj
2021-06-10 09:03:10 6.95MB LKA
1
状态:活动(在活动开发中,可能会发生重大更改) 该存储库将实现经典且最新的深度强化学习算法。 该存储库的目的是为人们提供清晰的pytorch代码,以供他们学习深度强化学习算法。 将来,将添加更多最先进的算法,并且还将保留现有代码。 要求 python <= 3.6 张量板 体育馆> = 0.10 火炬> = 0.4 请注意,tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败: 安装健身房 pip install gym 安装pytorch please go to official webisite to install it: https://pytorch.org/ Recommend use Anaconda Virtual Environment to manage your packages 安装tensorboardX pip install tensorboardX pip install tensorflow==1.12 测试 cd Char10\ TD3/ python TD3
1