只为小站
首页
域名查询
文件下载
登录
基于Python
强化学习
PPO算法在中国A股市场的应用(构建投资组合)
(1)在中国A股市场15只股票上的应用 (2)构建投资组合 (3)每日调仓 (4)绘制收益率曲线 (5)PPO算法
2024-05-20 15:27:15
4.29MB
python
量化投资
强化学习
投资组合
环境动力学已知条件下策略迭代与值迭代的
强化学习
算法
1. 这是作者花费一周的时间,使用python写出的策略迭代和值迭代
强化学习
算法,以一个完整的项目发布,为解决“已知马尔科夫决策过程五元组,求最优策略”这类问题提供了算法与通用框架 2. 项目采用面向对象架构和面向抽象编程,用户可以在抽象类基础上,利用继承机制,定义新的具体环境类,测试该算法的有效性。项目还给出了unittest.Testcase的测试代码。 3. 在该项目中算法名称分别对应类:ValueIterationAgent和PolicyIterationAgent(都继承自MdpAgent),马尔科夫决策模型已知的环境抽象类MdpEnv 4. 为展示该算法的有效性,定义了一个GridWorldEnv的具体类,实现了作者博文中“在格子世界中寻宝”的最优策略的学习,并定义了一个GridWorldUI类可视化最优策略及基于最优策略的,用户可以运行住文件main.py 5. 该项目源码的最大特点是:架构合理,可维护性好,可读性强。你不断能学到这两个
强化学习
算法的精髓,也能够学到什么是好的python程序架构。 6.注意先阅读里面的readme.txt文件。
2024-05-08 21:56:25
329KB
强化学习
策略迭代
面向对象
python
1
2018-real-clone2-10.8s.rar
(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套 train and evaluation log
2024-04-08 16:59:03
2.5MB
强化学习
1
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真,这个是matlab自带的一个案例,在simulink入门60例中【Simulink教程案例50】,以该模型为例,对该模型进行介绍。
2024-04-08 10:23:07
228KB
matlab
DDPG
强化学习
1
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDP
强化学习
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。 使用说明 python版本: 3.10.13 依赖库:requirements.txt 安装依赖库:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
2024-03-12 21:16:32
53.97MB
1
基于深度
强化学习
的拟人化自动驾驶行为决策研究
(1)针对自动驾驶拟人化决策需要识别驾驶风格的需求, 基于客观驾驶数据和主观问卷分析了驾驶风格,提出了 种驾驶风格分类模型。 (2)针对驾驶员对驾驶安全性、舒适性和行车效率的需求, 分别基千深度Q网络(Deep Q Network, DQN)和优势演员评论家(Advantage Actor Criti c, A2C)两种深度
强化学习
算法建立了决策模型。 (3)针对当前自动驾驶决策不够拟人化的问题,基千表现更好的DQN决策模型提出了一种结合驾驶风格的拟人化决策模型。
2024-03-11 19:38:09
35.43MB
自动驾驶
深度强化学习
行为决策
毕业设计
1
pytorch实现的在线
强化学习
11种常见算法代码
这个资源是一个包含了使用 PyTorch 实现的11种常见在线
强化学习
算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26
6.68MB
pytorch
强化学习
python
1
动态避障 ROS机器人
强化学习
使用深度
强化学习
算法实现端到端的无人车避障 使用ROS和gazebo环境下仿真 python脚本编写
2024-02-24 20:12:35
4.42MB
python
1
精品--基于深度
强化学习
的部分计算任务卸载延迟优化.zip
精品--基于深度
强化学习
的部分计算任务卸载延迟优化
2024-02-05 23:31:06
4KB
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
IEEE33节点配电网Simulink模型.rar
2021华为芯片研发岗位笔试题
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
人体姿态检测
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
IBM CPLEX 12.10 学术版 mac操作系统安装包
Python+OpenCV实现行人检测(含配置说明)
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
Alternative A2DP Driver 1.0.5.1 无限制版
C4.5决策树算法的Python代码和数据样本
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
基于VMD算法的信号降噪.rar
最新下载
终极妄撮(电脑版)-支持自定义图片
UnityDownloadAssistant-2020.1.6f1.exe
Java Web 商城源码
vb 写的抓包代码,非常好用
音创点歌机刷机文件 可以插卡刷
极域2022专业版2.7.17442
pose_hrnet_w32_256x192.pth
汉字拼音对照表
溃坝洪水分析软件——陈祖煜院士
火狐浏览器代理插件foxyproxy与SwitchyOmega.rar
其他资源
verilogFLASH读写时序
spring boot+mybatis plus 在线答题系统
Robot Framework --源代码分析
ENVI 小熊工具箱v3.0.rar
页面置换算法的模拟实现及命中率对比
深圳赋安FS5050编程软件
一种LCD汉字取模显示方法.rar
NBT-Manipulator:允许在运行时编辑NBT-源码
学生个人信息登记表.doc
mysql-5.7.rar
深圳iTest WT-20x系列WLAN终测仪使用FAQ Ver 1.0
pyllars:此存储库包含适用于Python 3的支持实用程序,重点是数据科学任务-源码
enigmadragons.github.io:Enigma Dragons网站-源码
Grafana-jmeter面板插件json文件(可以显示各个交易的TPS曲线)
学生信息管理系统.zip
USB转FT232RL串口蓝牙模块BLK-MD-BC04 AD09设计硬件原理图+PCB+封装库文件.zip
网页前端开发教程合集.zip
sogou_pinyin
tomatoEdit_2013.8.19.rar
简易通讯录的实现,可以显示,修改,查询从文件读入读出
XP系统磁盘分区工具
网络RTK连接测试
银行排队叫号系统(完整版)
利用python的scrapy爬取慕课网全站课程数据存入Mysql
火车车次查询系统(含源程序)
坦克大战 c++ 源代码
apache-ant-1.9.1-bin.tar.gz