股票买卖最佳时机leetcode
DDPG-股市-测试
建立DDPG模型并在股票市场上进行测试
参考
原始论文中的代码
环境的灵感来自
DDPG
实施的灵感来自
数据集
15份2018年1月1日至2018年10月29日的股价数据,以分钟为单位记录,具有开盘、收盘、高、低、成交量特征,下载自,BATS全球市场。
基本设置
该操作包含现金头寸、15
只股票的多头头寸和
15
只股票的空头头寸。
每分钟观察一次股价数据,但每
7
分钟才行动一次。
在每个步骤中,除了原始的
(s,
a,
r,
s')
之外,还收集了“推断步骤”的其他状态-动作对并存储在重放内存缓冲区中。
结果
这些模型采用时间序列滚动方案构建,使用上个月的数据构建
rl
模型并在下个月进行测试。
该模型在2018/02/01至2018/10/29期间达到14%的收益率,相比之下,采用统一买入15只股票并持有策略的收益率为5.6%,而采用业绩最佳买入策略的收益率为-16.8%上个月的库存。
ipython
笔记本中的更多详细信息。
股票市场中的
rl
模型可能非常不稳定,并且容易过度拟合。
该模型只在投资组合的很小部分进行买卖
2022-03-21 22:29:59
11.79MB
系统开源
1