搜索【强化学习】的结果

（1）在中国A股市场15只股票上的应用（2）构建投资组合（3）每日调仓（4）绘制收益率曲线（5）PPO算法

2024-05-20 15:27:15 4.29MB python 量化投资 强化学习 投资组合

1. 这是作者花费一周的时间，使用python写出的策略迭代和值迭代强化学习算法，以一个完整的项目发布，为解决“已知马尔科夫决策过程五元组，求最优策略”这类问题提供了算法与通用框架 2. 项目采用面向对象架构和面向抽象编程，用户可以在抽象类基础上，利用继承机制，定义新的具体环境类，测试该算法的有效性。项目还给出了unittest.Testcase的测试代码。 3. 在该项目中算法名称分别对应类：ValueIterationAgent和PolicyIterationAgent(都继承自MdpAgent)，马尔科夫决策模型已知的环境抽象类MdpEnv 4. 为展示该算法的有效性，定义了一个GridWorldEnv的具体类，实现了作者博文中“在格子世界中寻宝”的最优策略的学习，并定义了一个GridWorldUI类可视化最优策略及基于最优策略的，用户可以运行住文件main.py 5. 该项目源码的最大特点是：架构合理，可维护性好，可读性强。你不断能学到这两个强化学习算法的精髓，也能够学到什么是好的python程序架构。 6.注意先阅读里面的readme.txt文件。

2024-05-08 21:56:25 329KB 强化学习 策略迭代 面向对象 python

1

2018-real-clone2-10.8s.rar

(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套 train and evaluation log

2024-04-08 16:59:03 2.5MB 强化学习

1

通过simulink实现基于DDPG强化学习的控制器建模与仿真

通过simulink实现基于DDPG强化学习的控制器建模与仿真，这个是matlab自带的一个案例，在simulink入门60例中【Simulink教程案例50】，以该模型为例，对该模型进行介绍。

2024-04-08 10:23:07 228KB matlab DDPG 强化学习

1

强化学习的学习代码，算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDP

强化学习强化学习的学习代码，算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。使用说明 python版本： 3.10.13 依赖库：requirements.txt 安装依赖库：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

2024-03-12 21:16:32 53.97MB

1

基于深度强化学习的拟人化自动驾驶行为决策研究

(1)针对自动驾驶拟人化决策需要识别驾驶风格的需求，基于客观驾驶数据和主观问卷分析了驾驶风格，提出了种驾驶风格分类模型。 (2)针对驾驶员对驾驶安全性、舒适性和行车效率的需求，分别基千深度Q网络(Deep Q Network, DQN)和优势演员评论家(Advantage Actor Criti c, A2C)两种深度强化学习算法建立了决策模型。 (3)针对当前自动驾驶决策不够拟人化的问题，基千表现更好的DQN决策模型提出了一种结合驾驶风格的拟人化决策模型。

2024-03-11 19:38:09 35.43MB 自动驾驶 深度强化学习 行为决策 毕业设计

1

pytorch实现的在线强化学习11种常见算法代码

这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹，可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法： 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)

2024-03-05 21:19:26 6.68MB pytorch 强化学习 python

1

动态避障 ROS机器人强化学习

使用深度强化学习算法实现端到端的无人车避障使用ROS和gazebo环境下仿真 python脚本编写

2024-02-24 20:12:35 4.42MB python

1

精品--基于深度强化学习的部分计算任务卸载延迟优化.zip

精品--基于深度强化学习的部分计算任务卸载延迟优化

2024-02-05 23:31:06 4KB

1

个人信息

热门下载

最新下载

其他资源