深入浅出强化学习:原理入门
2022-08-24 09:07:41 112.32MB
1
改善败血症治疗策略 这是论文“使用深度强化学习和专家混合改善脓毒症治疗策略”的代码库 评论者评论 表1中的数据清楚地显示了数据集幸存者/非幸存者的失衡率。 学习不平衡会导致分类器的预测模型出现偏差。 但是,作者没有详细说明他们如何通过使用特定的重新平衡方法或对成本敏感的学习方法来解决此问题,但未提供任何评论。 数据集分为固定的75%训练和验证集和25%的测试集。“->作者应使用10倍交叉验证。 如表2所示,尽管他们的专家混合(MoE)方法的性能在数值上优于医师,内核和DQN的性能,但分析这种数值增加的显着性还是不错的。 随机策略会产生什么效果? 有没有一种方法可以衡量这些方法之间的性能差异的重要性? 本文未介绍其方法的任何时间性能。 训练这种方法需要多长时间? 这个培训时间对于为ICU患者制定个性化治疗策略是否可行? RL和Deep网络都因训练时间长而臭名昭著。 动机 败血症是IC
2022-08-16 14:27:18 478KB JupyterNotebook
1
基于MATLAB和Simulink Robotics Arena的行走机器人示例
2022-08-15 09:08:34 149.81MB 机器人 人工智能 强化学习 神经网络
1
本书首次在工业界系统地披露强化学习在实践应用的技术细节,其中更包含了阿里算法工程师对强化学习的深入理解、思考和创新。此书共有12个章节,作者团队跨越了多个阿里核心算法团队,可谓是最强阵容打造的黄金进阶书籍。
2022-08-06 23:00:06 17.55MB 强化学习 阿里 虚拟技术 现实应用
1
深度强化学习,Deep Reinforcement Learning by Sergey Levine,172页英文文档。
2022-08-04 00:05:25 10.34MB 强化学习 Levine
1
计算机基础操作系统思维导图
2022-08-02 09:00:47 20.56MB 强化学习
1
Oracle Database 19c 是最新的长期版本,支持期限最长; 19.3 - 企业版(也包括标准版 2) 适用于WINDOWS X64位系统。
2022-07-30 09:04:30 1.17MB oracle 开发工具 数据库 强化学习
1
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
2022-07-29 00:17:17 3KB matlab
1
火箭着陆器OpenAI环境 这是一款以SpaceX的Falcon 9第一阶段火箭为模型的垂直火箭着陆模拟器。 该仿真是在Python 3.5中开发的,并且是使用编写。 Box2D是首选的物理引擎,其环境类似于 。 是正在运行的模拟器的视频。 代码用于: 比例积分控制(PID) 深度确定性策略梯度(DDPG) 现代预测控制(MPC) 也可用,但不能一概而论。 其他可用的示例代码: 进化策略(ES) 函数近似Q学习(FA Q学习) 线性二次调节器(LQR) 该项目的主要贡献是环境,其中包括用于控制器的其他脚本,以供上下文和一般参考。 在environments存在用于仿真的代码。 入门 下载仓库。 火箭着陆器可能是分叉的,并作为单独的包装提供,最终可以使用pip安装。 先决条件 运行项目所需的库列表:(某些库,例如cvxpy需要其他先决条件)。 Windows用户访问[Wi
2022-07-27 09:29:48 32MB Python
1
SIGGRAPH 2018论文随附的介绍代码:“ DeepMimic:基于实例的角色导向的深度强化学习(基于物理的角色技能)”。 该框架使用强化学习来训练模拟人形动物,以模仿SIGGRAPH 2018论文随附的变量介绍代码:“ DeepMimic:基于实例的角色技能指导深度强化学习”。 该框架使用强化学习来训练模拟人形生物,以模仿来自运动捕捉数据的各种运动技能。 项目页面:https://xbpeng.github.io/projects/DeepMimic/index.html依赖项sudo apt安装libgl1-mesa-dev libx11-dev libxrandr-dev libxi-dev sudo apt安装mesa-utils sudo apt安装clang sudo apt安装cmake C ++:
2022-07-26 19:15:01 369.39MB C/C++ Machine Learning
1