搜索【深度强化】的结果

算法股票交易已经成为当今金融市场的一种主要交易方式，大多数交易现在已经完全自动化。深度强化学习（DRL）代理被证明是一种力量，在许多复杂的游戏，如国际象棋和围棋不可忽视。本文将股票市场的历史价格序列和走势看作是一个复杂的、不完全的信息环境，在这个信息环境中，本文试图实现收益最大化和风险最小化。

2021-07-09 12:06:59 1.5MB 强化学习

1

深度强化学习.rar

深度强化学习课程的高清课间资源，对于学习深度学习以及强化学习理论的研究人士很有帮助

2021-07-07 10:18:39 159.03MB 深度学习 强化学习

1

Rainbow：Rainbow：结合深度强化学习的改进-源码

彩虹 Rainbow：结合深度强化学习的改进。结果和预先训练的模型可以在找到。 DQN Double DQN 优先体验重播决斗网络体系结构多步骤退货分布式RL 吵网使用默认参数运行原始Rainbow： python main.py 可以使用以下选项运行数据有效的Rainbow （请注意，实际上，此处通过手动设置内存容量与最大时间步数相同来实现“无界”内存）： python main.py --target-update 2000 \ --T-max 100000 \ --learn-star

2021-06-29 19:00:21 17KB deep-learning deep-reinforcement-learning DeeplearningPython

1

Deep-Reinforcement-Learning-for-Automated-Stock-Trading-Ensemble-Strategy-ICAIF-2020:用于自动股票交易的深度强化学习-源码

自动股票交易的深度强化学习：整体策略该存储库提供了代码的Jupiter Notebook重新实现了这种整体策略。抽象的股票交易策略在投资中起着至关重要的作用。但是，在复杂而动态的股票市场中设计一种有利可图的战略是具有挑战性的。在本文中，我们提出了一种深度集成强化学习方案，该方案可以通过最大化投资回报来自动学习股票交易策略。我们训练一种深度强化学习代理，并使用三种基于行为者批评的算法来获得整体交易策略：近距离策略优化（PPO），优势参与者批评者（A2C）和深度确定性策略梯度（DDPG）。集成策略继承并集成了三种算法的最佳功能，从而可以稳健地适应不同的市场条件。为了避免在具有连续动作空间的训练网络中消耗大量内存，我们采用按需加载方法来处理非常大的数据。我们在30支具有足够流动性的道琼斯股票上测试了我们的算法。评估了具有不同强化学习算法的交易代理商的表现，并与道琼斯工业平均

2021-06-29 11:09:24 17.62MB deep-reinforcement-learning openai-gym sharpe-ratio ddpg

1

智能无线通信技术研究概况

近年来，人工智能技术已被应用于无线通信领域，以解决传统无线通信技术面对信息爆炸和万物互联等新发展趋势所遇到的瓶颈问题。首先介绍深度学习、深度强化学习和联邦学习三类具有代表性的人工智能技术；然后通过对这三类技术在无线通信中的无线传输、频谱管理、资源配置、网络接入、网络及系统优化5个方面的应用进行综述，分析和总结它们在解决无线通信问题时的原理、适用性、设计方法和优缺点；最后围绕存在的局限性指出智能无线通信技术的未来发展趋势和研究方向，期望为无线通信领域的后续研究提供帮助和参考。

2021-06-23 17:55:26 771KB 人工智能 无线通信 深度学习 深度强化学习 联邦学习

1

论文研究-基于深度强化学习的动态计算卸载 .pdf

基于深度强化学习的动态计算卸载，程百川，刘丹谱，移动边缘计算在移动网络边缘提供计算资源。为了减少执行时延，计算密集型任务可以从用户设备卸载到移动边缘服务器。当考虑到任务

2021-06-21 09:50:46 320KB 无线通信

1

tetris-ai:玩俄罗斯方块的深度强化学习机器人-源码

俄罗斯方块使用深度强化学习的机器人。演示版经过一些训练后，首先获得10000分。它是如何工作的强化学习首先，代理将进行随机移动，将状态和给定的奖励保存在有限的队列（重播内存）中。在每个情节（游戏）结束时，代理将使用重播内存的随机样本来训练自己（使用神经网络）。随着玩越来越多的游戏，代理变得越来越聪明，得分越来越高。由于在强化学习中，一旦特工发现了良好的“路径”，它就会坚持下去，因此它也被视为探索变量（随时间而减小），因此特工有时会选择一种随机动作，而不是它认为最佳的动作。。这样，它可以发现新的“路径”以获得更高的分数。训练培训基于。相反，只使用所获得的当前状态，并奖励对网络进行训练的，它是用来Q学习（即认为从当前状态到未来的一个过渡），以找出什么是考虑到所有给定状态的最佳成绩未来的回报，即算法不是贪婪的。这使代理可以采取一些可能无法立即获得回报的举动，因此以

2021-06-17 15:24:26 3.8MB tetris deep-reinforcement-learning q-learning game-ai

1

基于深度强化学习的无人驾驶车道保持决策的研究_方川.caj

2021-06-10 09:03:10 6.95MB LKA

1

深度强化学习入门详细资料

内容包含Easy-RL的200页PDF,入门深度强化学习170页PPT,lecture-alphastar76页PDF.

2021-05-28 21:05:37 107.87MB RL DRL 强化学习 深度强化学习

1

深度强化学习算法与应用研究现状综述

深度强化学习主要被用来处理感知-决策问题，已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法，详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理，并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后，对深度强化学习的算法和应用进行展望，针对一些未来的研究方向和研究热点给出了建议。

2021-05-21 15:18:32 2.92MB 深度强化学习 研究综述

1

个人信息

热门下载

最新下载

其他资源