为了帮助读者更加深入地理解深度强化学习细节,仔细地讲述了大量应用的实现细节,例如机器人学习跑步、机械臂控制、下围棋、多智能体平台
2022-02-21 09:28:29 175.22MB 深度学习 机器人
1
啊啊啊 多智能体遗传算法优化神经网络权值研究
1
针对一类具有任意初始状态的部分非正则多智能体系统,提出一种迭代学习控制算法.该算法将具有固定拓扑结构的多智能体编队控制问题转化为广义上的跟踪问题,即让领导者跟踪给定的期望轨迹,而跟随者要始终保持预定队形对某一智能体进行跟踪,并将该智能体作为自身的领导者.同时,为了使每个智能体在任意初始状态下都能按照期望队形进行编队,对每个智能体的初始状态设计迭代学习律,并从理论上对算法的收敛性进行严格证明,给出算法收敛的充分条件.所提出的算法对于各个智能体在任意初始位置条件下均能实现在有限时间区间内系统的稳定编队.最后,通过仿真算例进一步验证了所提出算法的有效性.
1
针对一阶非线性多自主体系统,采用脉冲控制的方法,研究系统的编队跟 踪问题,借助拉普拉斯矩阵的基本性质、矩阵论的基本理论、脉冲系统的稳定性理 论,得出了系统实现编队跟踪的充分条件。而且,由于在现实世界中,脉冲时刻并 不是总是均匀分布的,因此引入了平均脉冲间隔的概念。最后,通过仿真实例验证 了本章的理论结论是有效的
2022-01-24 19:08:02 1KB 矩阵 线性代数 matlab 跟踪仿真
BioMARL:基于生物启发式算法的多智能体强化学习算法 项目介绍: 多智能体系统(MAS)通过解决复杂任务的规模,可靠性和智能性,已被广泛的地面不同的应用领域,如计算机网络,机器人和智能电网等。和生产的重要因素。然而,以往的多代理通信研究主要是预先定义的通信协议或采用额外的决策模块进行通信调度,这将造成巨大的通信开销,并且不能直接推广到一个大型代理集合。了一个轻量级的通信框架:基于信息素协同机制的分布式深度Q网络算法(Pheromone协作深度Q网络,PCDQN) ,它结合了深度Q网络和stigmergy机制。我们证明了PCDQN框架的优越性,同时也将我们的模型转移到解决多代理路径搜索问题上。利用PCDQN框架,多代理编队能够学习适当的策略,成功地在雷区导航环境中获得最优路径。 实验环境 Windows10操作系统,8GB内存,2核Intel Core i7-6500U pytorch-
2021-12-30 23:40:46 7.65MB Python
1
在城市交通环境,交通流的正确预测是比较困难,因为多个十字路口,这使得预设的交通控制 模型之间的相互作用和纠缠在一起,不能在所有的交通情况下始终保持高性能的预测。考虑 到的强化学习的所具有的自主学习能力,本文提出了基于多智能体强化学习的交通信号控制方 法。没有预设的控制模型,多协作代理可以学习相应的实时交通状况下的最优控制策略。通过 实验结果证明了这种方法的可行性和有效性。
2021-12-30 22:47:49 237KB 综合文档
1
首先阐述了智能体技术的相关定义及特性,通过分析国内外多智能体技术的应用研究文献,对多智能体系统的基础研究进行分析并梳理了多智能体一致性及控制等方向的技术发展。接着选取了机器人控制和无线传感器网络两个领域重点,探讨了近年来多智能体技术在实际工程中的应用变化与最新成果。最后,总结了多智能体技术在工程应用中有待解决的主要问题,指出了未来多智能体技术应用的研究方向。
2021-12-28 21:50:09 641KB 论文研究
1
供AI智能体学习的室内场景合成数据集, 其中包含 卧室场景的以下几类图:深度图、实例图、法向图、渲染图、语义图、wall_mask
1
智能体系统教材课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案课件合集.pptx
2021-12-17 10:02:03 5.26MB
学习深度学习和强化学的人
2021-12-14 19:06:27 236KB AI machinelearning
1