确定性清洁机器人的基于模型的策略迭代算法。 这段代码是策略迭代算法的一个非常简单的实现,对于强化学习和动态规划领域的初学者来说,它是一个有用的起点。 确定性清洁机器人 MDP:清洁机器人必须收集用过的罐子,还必须为电池充电。 状态描述了机器人的位置,动作描述了运动的方向。 机器人可以向左或向右移动。 第一个 (1) 和最后 (6) 个状态是终止状态。 目标是找到一个最优策略,使任何初始状态的回报最大化。 这里是policy-iteration(基于模型的策略迭代DP)。 参考:算法 2-5,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien}, 年={2010}, 出版商={CR
2022-03-18 18:15:06 3KB matlab
1
通过动态确定性数据包标记实现可行的IP回溯框架
2022-03-10 10:56:32 579KB 研究论文
1
OpenCossan 是一个基于 Matlab 的工具箱,用于不确定性量化和管理。 实施的框架包括第三方软件集成(例如 ANSYS)、高效的数值算法(例如线采样)和用于高性能计算的并行化。 OpenCossan 的功能可以概括为: 不确定性量化基于仿真的可靠性分析敏感性分析元建模随机有限元分析基于可靠性的优化
2022-03-08 16:10:17 13.23MB matlab
1
气动辅助变轨技术在节省推进、延长航天器寿命等方面具有可观的应用价值,但工程实践却严重受制于气动效应不确定性,因此,设计了针对气动效应不确定性的SMC-$H_2/H_\infty$鲁棒制导算法.算法基于高斯伪谱法获取的标称轨迹和控制序列,通过构建气动效应的不确定性模型,利用奇异摄动理论将气动辅助变轨飞行器动力学划分为位置和速度回路,设计滑模和鲁棒$H_2/H_\infty$控制器分别实现制导控制.进一步,通过MatLab/xPC和飞行器机载计算模块组成的实时仿真系统验证,所设计鲁棒制导算法在计算复杂度满足工程约束前提下,能够在存在气动效应不确定性的场景下实现标称轨迹的跟踪,表明所设计的鲁棒制导算法能够有效地增强系统的鲁棒性,具有重要的工程应用价值.
1
案例是使用六台 3D 打印机对 P99 进行建模。 到达服从泊松分布,平均到达率为每小时 24 人。 每个服务器的服务时间是确定性的 15 分钟。 绿色指示灯表示打印机处于空闲状态,而红色指示灯表示忙碌,其下方显示利用率百分比。 还显示了运行平均到达率、系统中的时间以及系统中的数量。 系统中的数量也根据模拟时间绘制。 默认为 8 小时。 该模型是使用基本 Simulink 模块构建的,因此可能难以遵循编程逻辑。 如果您有任何问题,请随时联系我。
2022-02-24 11:18:22 80.34MB matlab
1
大规模风电并网是实现电力低碳环保发展的必然趋势,而风电与负荷的随机波动性对系统的影响不容忽视。提出一种考虑模糊机会约束的低碳型经济调度模型,同时计及源荷两侧不确定性对含风电电力系统低碳调度的影响。将阶梯型的碳交易成本引入目标函数中,旨在降低系统碳排放量,提高系统风电消纳量。针对风电并网后系统的不确定因素,引入模糊机会约束,将确定性约束松弛为含有模糊变量的系统约束,利用梯形模糊参数将其清晰化处理,并通过CPLEX对模型进行求解。算例分析表明所提模型可有效提高风电消纳水平以及降低碳排放。
1
11月第3周资产配置报告:风险定价-复苏交易的确定性排序.pdf
2022-02-22 09:04:37 509KB 分析 研究 证券
基于“确定性神经网络”(一种国产神经网络)的连子棋开发SDK。 包含了相关的MFC对话框版本和控制台版本的Demo源码,还有相应的说明文档。
1
包含了可运行版本的EXE文件和对应的VS版源代码,详细的开发过程和使用文档可以参考相应的博客介绍。
2022-02-08 16:06:03 2.37MB 神经网络 人工智能 深度学习 机器学习
1
包含了至2022年2月7日为止训练出的确定性神经网络连子棋模型。 包含有三连子、四连子、五连子(五子棋)等直至十五连子的连子棋模型文件。 所有模型均在15x15大小的棋盘上进行的训练。
2022-02-08 16:06:02 2.65MB 神经网络 深度学习 机器学习 人工智能
1