上传者: 42134537
|
上传时间: 2021-11-06 16:36:30
|
文件大小: 6.09MB
|
文件类型: -
深度强化学习以实现动态组合管理
STAT 461课程项目
张克南
该存储库是提出的用于动态投资组合管理的强化学习模型的实现 。
动机
动态投资组合管理描述了根据股票价格顺序分配资产集合以最大化长期收益的过程。 从本质上讲,它属于强化学习的名声,代理商通过与环境互动来学习最佳策略。 因此,我们可以将投资组合的重新分配视为“行动”,将股票市场视为“环境”,将立即的投资回报视为“回报”。
问题陈述
考虑一个由m个资产和现金组成的投资组合。 我们使用向量w表示每项资产的权重,因此权重之和等于1。假设最后一次重新分配后的权重为w t-1 ,则在当前时间步结束时,权重转移到w ' t由于股票价格变动。 然后,我们需要重新分配投资组合,以使权重等于w t 。
MDP框架
与其他强化学习模型相同,我们需要首先将动态投资组合优化问题表述为马尔可夫决策过程(MDP)。
状态S T:标准化价格的历史很短。 考