现代控制理论 第七章 课件 清楚明白 条理清晰 看了就会
2022-09-28 20:53:29 562KB 自动化
1
基于深度强化学习的有人_无人机编队协调控制方法研究 数学建模 无人机遂行编队飞行中的纯方位无源定位
2022-09-16 12:53:35 4.75MB
1
在仿真环境vrep中,采用SAC(可收敛,之前发现网上有几个版本SAC不收敛),以opencv目标检测坐标为状态输入,以质点坐标为动作输出,奖励值设计为xy平面上四旋翼和小车的距离。当中还有TD3算法。可以熟悉vrep端口调用,一点目标检测算法,一点RL算法。
2022-09-15 09:09:37 575KB 强化学习 目标跟踪 视觉伺服 SAC
1
多智能体系统是一种分布式计算技术,可用于解决各种领域的问题,包括机器人系统、分布式决策、交通控制和商业管理等。这是被高引用的综述论文,入门可以看看。
2022-09-13 15:35:22 427KB
1
第一章 基于强化学习的实时搜索排序策略调控 ;第二章 延迟奖赏在搜索排序场景中的作用分析;第三章 基于多智能体强化学习的多场景联合优化;第四章 强化学习在淘宝锦囊推荐系统中的应用;第五章 基于强化学习的引擎性能优化;第六章 基于强化学习分层流量调控;第七章 风险商品流量调控;第八章 虚拟淘宝;第九章 组合优化视角下基于强化学习的精准定向广告 OCPC 业务优化;第十章 策略优化方法在搜索广告排序和竞价机制中的应用;第十一章 TaskBot -阿里小蜜的任务型问答技术;第十二章 DRL 导购-阿里小蜜的多轮标签推荐技术
2022-09-13 15:33:56 19.74MB 强化学习
1
matlab自编插值函数myinter.m,解决插值问题.希望能够对您有所帮助~~
2022-09-12 08:48:37 320B 插值 自编
1
香港中文大学信息工程系老师周博宇老师,主讲强化学习强化学习课件pdf版,一共10课。视频在bili网站。课程课件: https://github.com/zhoubolei/introRL 个人主页:http://bzhou.ie.cuhk.edu.hk/
2022-09-10 19:31:03 75.38MB 强化学习
1
本课件讲解了强化学习的基本问题,经典Q学习理论,深度Q学习理论和程序讲解与训练。
2022-09-10 19:26:21 2.2MB 强化学习
1
包括reinforcement learning :an introduction,insight+of+RL,Asynchronous Methods for Deep Reinforcement Learning,Playing Atari with Deep Reinforcement Learning,Reinforcement+learning_state+of+the+art等等
2022-09-10 01:14:03 34.83MB 强化学习
1
本文在城市突发事 件发生后待救点事故动态演变的背景下,将应急救 援需求的演变设计成一个马尔可夫决策过程,并构 建优化模型,然后利用花朵授粉算法对模型进行求 解。最后,以某市突发地震灾害,造成药品和食品 短缺为例进行实证研究。结果表明,本文提出的救 援物资需求决策模型使用马尔可夫决策过程方法, 模拟事故演变中待救点物资需求动态变化过程,并 做出合理的需求满足决策,可以合理的配置资源, 使整体救援需求保持平稳的状态,实现了救援需求 的优化,更好的完成救助任务。
2022-09-09 11:06:02 1.78MB 强化学习
1