OpenAI Baselines: 强化学习算法的高质量实现
2021-08-02 21:20:51 4.61MB Python开发-机器学习
1
最优控制全部课件
2021-08-02 09:58:27 13.46MB 最优控制
1
学习最优控制的很好的一般英文参考书的!值得珍藏!
2021-08-01 20:04:40 2.99MB 最优控制
1
1.动态规划、贝尔曼方程、最优值函数、值与策略迭代、最短路径、马尔可夫决策过程。2. 哈密顿-雅可比-贝尔曼方程,近似方法,nite和nite hori- zon公式,随机微积分基础。3.庞特利亚金的极大原理,ODE和梯度下降法,与经典力学的关系。4. 线性二次高斯控制,黎卡提方程,非线性问题的迭代线性逼近。5. 最优递推估计,卡尔曼滤波,扎卡方程。6. 最优控制与最优估计的对偶性(含新结果)。7. 电机控制中的最优模型,是一个很有前途的研究方向。
2021-08-01 20:02:13 223KB 最优控制理论
1
MATLAB强化学习代码包,用于解决多臂赌机问题的时变e-greedy策略 "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
2021-07-30 11:02:26 1KB MATLAB 强化学习 策略 多臂赌机问题
1
17年10月~12月多家公司的reinforcement learning面试真题。
2021-07-29 20:49:51 21KB 强化学习 面试题
1
Soft Actor-Critic(SAC)算法tensorflow实现,SAC是深度强化学习中对于连续动作控制的又一经典。
2021-07-26 20:10:17 19KB 强化学习
1
基于深度学习和强化学习的量化交易系统(基于深度学习和强化学习的定量交易系统) (中文版本在英文版本的下面,请拖动查看) 大纲: 主要结构 仍在努力 结论 主要结构: 该系统包括: 数据处理模块 价格预测模块 强化学习模块基于: 6个动作的设计(卖出,卖空,卖出持有,卖空,卖出,覆盖) 强化学习模块基于: 使用VWAP或BBIBOLL的上下线将价格转换为(-1,1) 分别设计两个增强学习模型,分别用于(买入,卖出持有)和(卖空,覆盖,持有) 设置两个模型的优先级,并决定应输出哪个操作 基于价格预测和RL收益的库存拣货策略 数据处理模块 我从Kaggle获得了数据集,该数据集是美国股票市场的每日价格和数量数据。 数据集包括开盘价,收盘价,高价,低价和数量。 但是,这种数据在深度学习和强化学习的训练中效果不佳。 因此,我创建了数十个技术分析功能以为输入生成更多功能。 通过这种方式
1
行业分类-物理装置-数据驱动的故障诊断与最优控制系统一体化设计方法.zip