搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

线性二次型最优控制概念

现代控制理论第七章课件清楚明白条理清晰看了就会

2022-09-28 20:53:29 562KB 自动化

1

基于深度强化学习的有人_无人机编队协调控制方法研究数学建模无人机遂行编队飞行中的纯方位无源定位

2022-09-16 12:53:35 4.75MB

1

基于SAC的四旋翼跟踪移动小车仿真

在仿真环境vrep中，采用SAC（可收敛，之前发现网上有几个版本SAC不收敛），以opencv目标检测坐标为状态输入，以质点坐标为动作输出，奖励值设计为xy平面上四旋翼和小车的距离。当中还有TD3算法。可以熟悉vrep端口调用，一点目标检测算法，一点RL算法。

2022-09-15 09:09:37 575KB 强化学习 目标跟踪 视觉伺服 SAC

1

多智能体强化学习综述_杜威.pdf

多智能体系统是一种分布式计算技术，可用于解决各种领域的问题，包括机器人系统、分布式决策、交通控制和商业管理等。这是被高引用的综述论文，入门可以看看。

2022-09-13 15:35:22 427KB

1

阿里强化学习资料

第一章基于强化学习的实时搜索排序策略调控；第二章延迟奖赏在搜索排序场景中的作用分析；第三章基于多智能体强化学习的多场景联合优化；第四章强化学习在淘宝锦囊推荐系统中的应用；第五章基于强化学习的引擎性能优化；第六章基于强化学习分层流量调控；第七章风险商品流量调控；第八章虚拟淘宝；第九章组合优化视角下基于强化学习的精准定向广告 OCPC 业务优化；第十章策略优化方法在搜索广告排序和竞价机制中的应用；第十一章 TaskBot －阿里小蜜的任务型问答技术；第十二章 DRL 导购－阿里小蜜的多轮标签推荐技术

2022-09-13 15:33:56 19.74MB 强化学习

1

自编插值函数

matlab自编插值函数myinter.m，解决插值问题.希望能够对您有所帮助~~

2022-09-12 08:48:37 320B 插值自编

1

香港周博宇老师强化学习课件-bili网站课程课件.zip

香港中文大学信息工程系老师周博宇老师，主讲强化学习，强化学习课件pdf版，一共10课。视频在bili网站。课程课件: https://github.com/zhoubolei/introRL 个人主页：http://bzhou.ie.cuhk.edu.hk/

2022-09-10 19:31:03 75.38MB 强化学习

1

强化学习课件.pdf

本课件讲解了强化学习的基本问题，经典Q学习理论，深度Q学习理论和程序讲解与训练。

2022-09-10 19:26:21 2.2MB 强化学习

1

强化学习书籍及论文打包

包括reinforcement learning ：an introduction，insight+of+RL，Asynchronous Methods for Deep Reinforcement Learning，Playing Atari with Deep Reinforcement Learning，Reinforcement+learning_state+of+the+art等等

2022-09-10 01:14:03 34.83MB 强化学习

1

城市突发事件中基于事故演变...援需求决策模型及其优化求解（2020 运筹与管理） md笔记与思维导图

本文在城市突发事件发生后待救点事故动态演变的背景下，将应急救援需求的演变设计成一个马尔可夫决策过程，并构建优化模型，然后利用花朵授粉算法对模型进行求解。最后，以某市突发地震灾害，造成药品和食品短缺为例进行实证研究。结果表明，本文提出的救援物资需求决策模型使用马尔可夫决策过程方法，模拟事故演变中待救点物资需求动态变化过程，并做出合理的需求满足决策，可以合理的配置资源，使整体救援需求保持平稳的状态，实现了救援需求的优化，更好的完成救助任务。

2022-09-09 11:06:02 1.78MB 强化学习

1

个人信息

热门下载

最新下载

其他资源