确定性清洁机器人的基于模型的策略迭代算法。 这段代码是策略迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 确定性清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (1) 和最后 (6) 个状态是终止状态。 目标是找到一个最优策略,使任何初始状态的回报最大化。 这里是policy-iteration(基于模型的策略迭代DP)。 参考:算法 2-5,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CR
2022-03-18 18:15:06 3KB matlab
1
最优库存分配 使用Python中的现代投资组合理论自动优化投资组合的资产权重和分配。
2022-03-17 14:46:07 577KB python portfolio allocation JupyterNotebook
1
matlab开发-基于模型的策略迭代gorithmfordeterministiccleaningrobot。基于模型的策略迭代强化学习实例
2022-03-13 12:34:12 3KB 未分类
1
OLPS, 在线投资组合选择工具箱 OLPSOLPS是一个用于在线投资组合选择的开源工具箱,它包括一系列在 matlab/Octave 中实现的行portofolio选择策略的经典和非经典。快速启动OLPS_gui.m 在GUI模式( 建议,仅在Matlab中可用
2022-03-12 15:48:40 3.82MB 开源
1
预期收益,方差和协方差是均方差投资组合选择问题的关键输入。 在传统的均值-方差投资组合模型中,先验排除了模型不确定性。 但是实际上,这些参数不是先验已知的,通常会估计有误。 当前的研究将模型不确定性纳入均值方差框架,但主要集中在不确定性均值上。 本文的目的是通过模糊性和模糊性厌恶的概念将不确定方差-协方差纳入均值方差投资组合模型。 本研究中开发的方法在数值上比较了收益歧义性和方差歧义性的影响。 尤其是,应通过股指数据重新检查不确定的方差-协方差是否会导致“不参与股市”和/或“房屋偏差”。
2022-03-10 22:09:22 2.88MB 行业研究
1
通用组合 该软件包的目的是将不同的在线投资组合选择算法放在一起,并为它们的分析提供统一的工具。 如果您不知道什么是在线投资组合,请查看, 或最近的一项。 简而言之,在线投资组合的目的是选择每个时期的投资组合权重,以最大化其最终财富。 这样的投资组合的例子可以是或。 当前,在线投资组合中有活跃的研究,尽管其结果大部分是理论上的,但实际使用的算法却开始出现。 基于现有文献和我的理解,目前已实现了文献中的几种算法。 非常欢迎您提供文稿或进行更正。 资源 有一个解释了该库的基本用法。 Paul Perry对此进行了跟进,并对较新的ETF数据集上进行了。 另请参阅最新。 关于讨论也很有趣。 一些算法的原始作者最近在github MATLAB中的在线投资组合选择工具箱中发布了自己的实现。 如果您更喜欢R,或者只是在寻找关于Universal Portfolios的良好资源,请查看Marc D
2022-03-09 20:35:22 8.22MB JupyterNotebook
1
pyfolio pyfolio是一个由开发的Python库,用于对金融投资组合进行绩效和风险分析。 它与开源回溯测试库很好地配合。 Quantopian还提供其中包括Zipline,Alphalens,Pyfolio,FactSet数据等。 pyfolio的核心是所谓的撕纸,它由各种单独的图组成,这些图提供了交易算法性能的全面图像。 这是一个简单的撕裂表分析策略的示例: 另请参阅。 安装 要安装pyfolio,请运行: pip install pyfolio 发展 对于开发,您可能希望使用来避免pyfolio与您拥有的其他Python项目之间的依赖关系冲突。 要设置虚拟环境,请运行: mkvirtualenv pyfolio 接下来,克隆此git存储库并运行python setup.py develop ,直接python setup.py develop和编辑库文件。 OSX
2022-03-09 13:38:06 11.5MB JupyterNotebook
1
2009年写的matlab mdp源码,里面有全部的英文document介绍说明
2022-03-07 03:40:09 225KB matlab mdp 源码 实现
1
对于含有不确定参数的采用CVaR风险度量的投资组合模型,基于鲁棒优化理论的最新进展,结合统计或时间序列,构造形式较为简单的椭球不确定集作为对参数不确定性的近似,把原问题转化为易于求解的确定型最优化问题,解决了该模型由于参数具有不确定性所造成的缺陷,得到鲁棒性与最优性都较为满意的解 。通过市场数据对模型的可操作性和实用性进行验证 。
2022-02-21 15:05:55 874KB 自然科学 论文
1
本文假设投资者是风险厌恶型,用CVaR作为测量投资组合风险的方法.在预算约束的条件下,以最小化CVaR为目标函数,建立了带有交易费用的投资组合模型.将模型转化为两阶段补偿随机优化模型,构造了求解模型的随机L- S算法.为了验证算法的有效性,用中国证券市场中的股票进行数值试验,得到了最优投资组合、VaR和CVaR的值.而且对比分析了有交易费和没有交易费的最优投资组合的不同,给出了相应的有效前沿.
2022-02-21 08:44:53 920KB 自然科学 论文
1