在仿真环境vrep中,采用SAC(可收敛,之前发现网上有几个版本SAC不收敛),以opencv目标检测坐标为状态输入,以质点坐标为动作输出,奖励值设计为xy平面上四旋翼和小车的距离。当中还有TD3算法。可以熟悉vrep端口调用,一点目标检测算法,一点RL算法。
2022-09-15 09:09:37 575KB 强化学习 目标跟踪 视觉伺服 SAC
1
1 .插值问题 ,多项式插值 2 .会写 Lagrange 插值多项式,理解插值基函数的形式与功能 会用误差公式 3 .分段线性插值 4 .分段三次插值和样条,了解两种插值方法需要满足的条件,不要求理解原理和插值 多项式的具体形式和求解方法,要求会用 Matlab 命令实现 5 .数值积分问题 6 .梯形公式,辛普森公式,复合梯形公式,复合辛普森公式,上述公式的误差分析 7 插值型求积公式 8 代数精度(理论分析) 9 quad 命令, 自适应步长的复合辛普森公式
2022-09-15 09:00:10 6KB matlab_复合梯形 diej3s matlab 演示程序
山猫飞控的完整版,注意这个飞控是供大家测试和共同探讨用的,要是您想要个能飞的飞控请不要下载了,浪费两分还多条毫无意义的评论没有任何意义。 关联的博客地址: http://blog.csdn.net/lynx2/article/details/9145027
2022-09-14 00:01:39 30.58MB 山猫飞控 自适应控制 四轴飞行器
1
针对常规自适应卡尔曼滤波器存在过渡过程差的间题,基于一个给定的指标切换函数,采用多个基于不同动态噪
声协方差矩阵的卡尔曼滤波器和一个常规自适应卡尔曼滤波器共同组成多模型自适应卡尔曼滤波器.与常规自适应卡尔曼
滤波器相比,多模型自适应卡尔曼滤波器可以在保持原有自适应滤波器性能的基础上极大地改善瞬态响应.
1
多智能体系统是一种分布式计算技术,可用于解决各种领域的问题,包括机器人系统、分布式决策、交通控制和商业管理等。这是被高引用的综述论文,入门可以看看。
2022-09-13 15:35:22 427KB
1
第一章 基于强化学习的实时搜索排序策略调控 ;第二章 延迟奖赏在搜索排序场景中的作用分析;第三章 基于多智能体强化学习的多场景联合优化;第四章 强化学习在淘宝锦囊推荐系统中的应用;第五章 基于强化学习的引擎性能优化;第六章 基于强化学习分层流量调控;第七章 风险商品流量调控;第八章 虚拟淘宝;第九章 组合优化视角下基于强化学习的精准定向广告 OCPC 业务优化;第十章 策略优化方法在搜索广告排序和竞价机制中的应用;第十一章 TaskBot -阿里小蜜的任务型问答技术;第十二章 DRL 导购-阿里小蜜的多轮标签推荐技术
2022-09-13 15:33:56 19.74MB 强化学习
1
matlab的素描代码Arduino的自适应Hopf频率振荡器演示 Arduino的adaptiveFreqOsc项目是一个自学习算法的迷人示例。 Ijspeert [1]提出了一个Hopf频率振荡器,并为其添加了一个额外的状态变量,以迫使振荡器跟随任何周期性的输入信号。 换句话说,这种类型的振荡器可以调整其参数以学习周期性输入信号的频率。 这里展示的Arduino草图是此类振荡器的实际实现示例。 首先,将来自Ijspeert的模型离散化,使其可以在Arduino上运行。 离散化的含义是,振荡器将不再与任何周期性输入信号同步。 必须考虑采样频率。 电流输出和振荡器输入之间的频率差越大,振荡器收敛到所需输入频率所需的时间就越长。 首先,尝试仅在输出和输入之间只有十分之一赫兹的差异的情况下学习振荡器,并使用Eps(ilon),gamma和mu的参数值来进行学习。 收敛后,带走输入信号,最后施加的输入频率将在系统中保持编码状态。 包含的Matlab脚本文件adaptive_Hopf.m用于Arduino的C代码的开发。 该脚本可用于在Arduino中实现振荡器之前调整振荡器参数。 无花果图1
2022-09-13 15:31:07 142KB 系统开源
1
为满足现代数控加工的高速度、高精度要求,提出基于7段式S曲线加减速全程规划的NURBS曲线自适应分段插补算法。该算法根据NURBS曲线几何形状将其自适应分段,并计算曲线段各项参数值、对应S曲线加减速规划(速度规划为17种类型)中加减速类型和自适应调整速度曲线加减速时间。在固定插补周期下,与单独自适应算法、5段式S曲线加减速控制方法的仿真结果相比,在满足加速度与加加速度限制条件,且最大弦高误差不超过0.5μm时,该算法插补精度高于单独自适应算法,与5段式S曲线加减速控制方法近似,且其全程平均进给速度比5段式
2022-09-13 10:41:49 139KB 工程技术 论文
1
动态拓扑网格 OpenFOAM 的并行、自适应、简单重新网格化的实现。 版权信息 Copyright (C) 2007-2015 Sandeep Menon University of Massachusetts Amherst. 执照 该程序是免费软件:您可以根据自由软件基金会发布的 GNU 通用公共许可证(许可证的第 3 版或(由您选择)任何更高版本)的条款重新分发和/或修改它。 这个程序是分发的,希望它有用,但没有任何保证; 甚至没有对适销性或针对特定目的的适用性的暗示保证。 有关更多详细信息,请参阅 GNU 通用公共许可证。 您应该已经收到一份 GNU 通用公共许可证以及该程序。 如果没有,请参阅 。 描述 为方便起见,源树被分成几个类: 动态拓扑网格 扩展 dynamicFvMesh 功能以处理动态简单网格的网格类,这些网格由 2D 中的三角棱柱和 3D 中的四面体组成。
2022-09-13 09:41:26 402KB C
1
香港中文大学信息工程系老师周博宇老师,主讲强化学习强化学习课件pdf版,一共10课。视频在bili网站。课程课件: https://github.com/zhoubolei/introRL 个人主页:http://bzhou.ie.cuhk.edu.hk/
2022-09-10 19:31:03 75.38MB 强化学习
1