只为小站
首页
域名查询
文件下载
登录
基于Python
强化学习
PPO算法在中国A股市场的应用(构建投资组合)
(1)在中国A股市场15只股票上的应用 (2)构建投资组合 (3)每日调仓 (4)绘制收益率曲线 (5)PPO算法
2024-05-20 15:27:15
4.29MB
python
量化投资
强化学习
投资组合
高斯伪谱算法C++封装库【直接使用,无依赖】
这是作者花了很多心血编译并封装的高斯伪谱算法等一系列
最优控制
算法的封装库,可以求解各种轨迹优化问题。项目主要基于Lpopc进行封装,并提供了visual studio demo项目供学习。通过ElegantGP(该库名称),您可以构建各种复杂
最优控制
问题并求解。它所依赖的arma和MKL我也都打包在了这个库中,您无需为依赖问题而烦恼。C++求解高斯伪谱算法,从现在开始将不再困难!
2024-05-16 18:01:59
431.14MB
最优控制
轨迹优化
环境动力学已知条件下策略迭代与值迭代的
强化学习
算法
1. 这是作者花费一周的时间,使用python写出的策略迭代和值迭代
强化学习
算法,以一个完整的项目发布,为解决“已知马尔科夫决策过程五元组,求最优策略”这类问题提供了算法与通用框架 2. 项目采用面向对象架构和面向抽象编程,用户可以在抽象类基础上,利用继承机制,定义新的具体环境类,测试该算法的有效性。项目还给出了unittest.Testcase的测试代码。 3. 在该项目中算法名称分别对应类:ValueIterationAgent和PolicyIterationAgent(都继承自MdpAgent),马尔科夫决策模型已知的环境抽象类MdpEnv 4. 为展示该算法的有效性,定义了一个GridWorldEnv的具体类,实现了作者博文中“在格子世界中寻宝”的最优策略的学习,并定义了一个GridWorldUI类可视化最优策略及基于最优策略的,用户可以运行住文件main.py 5. 该项目源码的最大特点是:架构合理,可维护性好,可读性强。你不断能学到这两个
强化学习
算法的精髓,也能够学到什么是好的python程序架构。 6.注意先阅读里面的readme.txt文件。
2024-05-08 21:56:25
329KB
强化学习
策略迭代
面向对象
python
1
2018-real-clone2-10.8s.rar
(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套 train and evaluation log
2024-04-08 16:59:03
2.5MB
强化学习
1
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真,这个是matlab自带的一个案例,在simulink入门60例中【Simulink教程案例50】,以该模型为例,对该模型进行介绍。
2024-04-08 10:23:07
228KB
matlab
DDPG
强化学习
1
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDP
强化学习
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。 使用说明 python版本: 3.10.13 依赖库:requirements.txt 安装依赖库:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
2024-03-12 21:16:32
53.97MB
1
基于深度
强化学习
的拟人化自动驾驶行为决策研究
(1)针对自动驾驶拟人化决策需要识别驾驶风格的需求, 基于客观驾驶数据和主观问卷分析了驾驶风格,提出了 种驾驶风格分类模型。 (2)针对驾驶员对驾驶安全性、舒适性和行车效率的需求, 分别基千深度Q网络(Deep Q Network, DQN)和优势演员评论家(Advantage Actor Criti c, A2C)两种深度
强化学习
算法建立了决策模型。 (3)针对当前自动驾驶决策不够拟人化的问题,基千表现更好的DQN决策模型提出了一种结合驾驶风格的拟人化决策模型。
2024-03-11 19:38:09
35.43MB
自动驾驶
深度强化学习
行为决策
毕业设计
1
pytorch实现的在线
强化学习
11种常见算法代码
这个资源是一个包含了使用 PyTorch 实现的11种常见在线
强化学习
算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26
6.68MB
pytorch
强化学习
python
1
动态避障 ROS机器人
强化学习
使用深度
强化学习
算法实现端到端的无人车避障 使用ROS和gazebo环境下仿真 python脚本编写
2024-02-24 20:12:35
4.42MB
python
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2020年数学建模B题(国二)论文.pdf
航迹融合算法MATLAB仿真程序
基于YOLOV5的车牌定位和识别源码.zip
多机器人编队及避障仿真算法.zip
画程(版本6.0.0.127)setup个人版
2019综合测评仿真.zip
基于VMD算法的信号降噪.rar
转速、电流双闭环直流调速Simulink源文件.zip
基于yolov4-keras的抽烟检测(源码+数据集)
基于Python网络爬虫毕业论文.doc
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
Spring相关的外文文献和翻译(含出处).zip
C4.5决策树算法的Python代码和数据样本
狂神说Java系列笔记.rar
python实现的学生信息管理系统—GUI界面版
最新下载
stars:区域系统的时空分析-源码
PR插件集合
科来网络分析系统15.2.0.15277-技术交流版
中国科学院大学自然语言处理 期末试题(宗成庆).pdf
OFD转换工具.zip
STM32F4_HAL库_CANopen主从端数据传输例子.rar
科来网络分析系统-技术交流版-csnas-tech-v15.2.0.15239-x64
Debenu Quick PDF Library v12.12序列号
OPC客户端测试工具
Qt Creator快速入门(第三版)带目录可注释版pdf
其他资源
华为模拟电路设计全册
CIE坐标计算软件
单片机课件赵志衡主讲
CUTE80数据集
STM32f103超声波模块例程
YOLO系列论文翻译
springboot 业务插件demo
VMware-viewconnectionserver-x86_64-6.2.1-3284346.exe
通过sqlite数据库实现的曾珊盖查的通讯录
汇编语言编写的贪吃蛇
romax英文原版教程
HL7接口开发商中文使用手册.doc
ch18-Distributed Coordination.ppt
09阿里百秀项目实战
SnippingToolFor2008
MXNet fashion-mnist数据集
多线程网络文件传输的设计与实现
基于dsPIC的精跟踪控制系统设计
PIC 单片机软件模拟串口