第2课 马尔可夫决策过程
2022-10-17 13:05:43 334KB 马尔可夫决策过程 MDP 强化学习
1
第4课 强化学习中的蒙特卡洛方法
2022-10-17 13:05:41 2.03MB 强化学习 蒙特卡洛
1
第5课 强化学习中的时间差分
2022-10-17 13:05:40 1.89MB TemporalDiffere 强化学习
1
第7课 强化学习中的深度Q网络(DQN)
2022-10-17 13:05:36 570KB 强化学习 DQN
1
强化学习中的python和numpy编程基础
2022-10-17 13:05:35 78KB python numpy 强化学习
1
【jupyter notebook】强化学习中的蒙特卡洛方法-算法实现笔记
2022-10-17 13:05:34 2.22MB MC 蒙特卡洛
1
【jupyter notebook】强化学习中的时间差分算法实现笔记
2022-10-17 13:05:33 1.24MB TD 强化学习 时间差分
1
任务空间多路径段平滑过渡可提高工业机器人的运动速度.在非对称S曲线加减速控制的路径长度约束下,以给定速度不为零的路径衔接点和半径调节参数为基准,根据路径段的长度变化,自适应前瞻规划出路径段间最优衔接速度,并在相邻路径段间采用圆弧进行平滑过渡,路径段全程采用非对称S曲线加减速控制.为提高算法的通用性,根据S曲线加减速区段函数的特点,对加速和减速区段函数进行优化.在6自由度工业机器人实时控制系统平台上进行实验验证,结果表明,与传统加减速控制算法相比,该前瞻算法的作业执行效率可提高22.03%以上,并可实现多路径段间速度的平滑过渡和轨迹的修形.
1
AI-奥林匹克·相扑比赛基于规则的智能体和基于强化学习的智能体解决方案,该方案训练出的智能体能进入对战排行榜前十。基于代码实现的规则,能进入排行榜前三。 1 手动提取特征(manual feature extraction) 2 重新封装环境 3 训练表现
2022-10-16 22:08:12 7.81MB 强化学习 AI-奥林匹克 相扑比赛 PPO
1
民用飞机在巡航和机动飞行过程中经常会不可避免地受到阵风或大气紊流的影响,而产生气动力和力矩,带给飞机的是不希望的附加过载,致使飞机在飞行中产生振动、颠簸等现象。针对这一问题,采用一种新的L1自适应控制方法来设计阵风减缓控制系统。文章首先概述了L1自适应控制方法的基本结构;然后构建存在大气紊流影响时的飞机模型,并具体结合L1自适应控制方法,设计民机阵风减缓控制律;最后对所设计的控制系统进行了仿真验证,结果表明:所设计的L1自适应控制器能够起到良好的阵风减缓作用。
1