基于Bang-Bang原理的时间最优控制问题求解
2021-12-16 11:50:39 184KB 砰砰控制
1
本文转自『深度强化学习实验室』 NeurIPS(前称NIPS)可谓人工智能年度最大盛会。每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大会的技术往往这未来几年就会演变成真正的研究甚至应用成果。NIPS2019大会将在12月8日-14日在加拿大温哥华举行,据官方统计消息,NeurIPS今年共收到投稿6743篇,再次打破了历年来的接收记录。其中接收论文1429篇。论文发表机构统计 Google共179篇 其中Deepmind-53篇 Google-Brain-Research-126篇  NVIDIA上榜9篇 斯坦福上榜79篇 MIT上榜77篇 卡耐基梅隆上榜75篇
2021-12-15 22:51:00 1.13MB rl 代理模式 优化策略
1
健身室 Gym-JSBSim使用JSBSim飞行动力学模型为固定翼飞机的控制提供了强化学习环境。 Gym-JSBSim需要类似Unix的操作系统和Python 3.6。 软件包的环境实现了OpenAI Gym界面,允许以通常的方式创建环境并与之交互,例如: import gym import gym_jsbsim env = gym.make(ENV_ID) env.reset() state, reward, done, info = env.step(action) Gym-JSBSim可选地使用FlightGear仿真器提供受控飞机的3D可视化。 依存关系 飞行动力学模型,包括C ++和Python库 FlightGear模拟器(可视化的可选) 健身房,numpy,matplotlib 安装 首先,按照信息库上的说明安装JSBSim及其库。 确认从终端安装了JSBSim:
2021-12-15 18:40:13 51KB Python
1
第9课:强化学习与DQN.pdf
2021-12-15 18:11:33 5.97MB 机器学习
1
matlab三次样条插值函数代码gen_traj_lib 说明: 嵌入ROS的用于轨迹生成的C ++库。 提供了一个抽象基类( TrajectoryBase )。 它用于加载以.txt文件(具有指定格式)编写的所需航路点,以及通过以下方法之一插值数据:三次样条,多项式阶数3 ,多项式阶数5和多项式阶数7 。 然后给出了派生类的三个选项: TrajectoryNd :关节空间中N维变量的轨迹生成。 Trajectory3dQuat :3D空间轨迹生成,其方向由单位四元数表示。 Trajectory3dEuler :3D空间轨迹生成,其方向由侧倾-俯仰-偏航欧拉角(等效于ZYX约定)表示。 快速指南: 示例和文档(在“ doc /”文件夹中): 有关使用三种不同派生类的说明,请参见“ doc / example_codes.txt”。 有关插值方法(三次样条,不同阶数的多项式函数)的详细信息,请参阅“ doc / trajectory_interpolation.pdf”。 可以在“ doc / 3Dspace_representation /”文件夹中找到通过四元数或欧拉角表示方向的3D
2021-12-15 16:42:05 1.26MB 系统开源
1
OptimalControl_2019S 优化与最优控制理论的作业
2021-12-15 09:58:36 197KB JupyterNotebook
1
连续系统的极小值原理 设系统 维连续可微矢量函数 待定终端时刻。 均为连续可微的函数, 维连续可微矢量函数
2021-12-14 22:01:38 3.41MB 最优控制
1
针对传统LQR最优控制器权重矩阵确定困难以及由此导致的响应速度慢等问题,以具有多变量、强耦合、非线性特点的两轮自平衡小车为被控对象,提出了一种通过遗传算法实现LQR控制器参数寻优的方法。选择线性二次型性能指标为目标函数,利用遗传算法的全局优化搜索能力,获取权阵Q的最优解,从而设计状态反馈控制率K,搭建系统动力学模型进行仿真实验。实验结果表明:该方法设计的最优控制器相对于传统的极点配置和LQR方法具有更好的控制效果,系统响应速度更快,超调更小。
2021-12-14 18:46:03 694KB 行业研究
1
股票学习 使用强化学习来帮助做出购买股票的决策。
2021-12-14 16:49:03 2KB
1
绝对可以用的二级倒立摆模型。simulink建模,matlab编写s函数,使用lqr最优控制
2021-12-14 11:45:54 580KB simulink建模
1