公用池资源系统中的深度多主体强化学习 中的论文中的实验源代码。 该论文已被接受并发表在IEEE CEC 2019上。 介绍 在复杂的社会生态系统中,具有不同目标的多个代理机构采取的行动会影响系统的长期动态。 共同资产池是此类系统的子集,在这些系统中,财产权通常定义不清,先验性未知,因此造成了社会困境,这是众所周知的公地悲剧反映出来的。 在本文中,我们研究了在公共资源池系统的多主体设置中进行深度强化学习的功效。 我们使用了系统的抽象数学模型,表示为部分可观察到的一般和马尔可夫博弈。 在第一组实验中,独立主体使用具有离散动作空间的深度Q网络来指导决策。 但是,明显的缺点是显而易见的。 因此,在第二组实验中,具有连续状态和动作空间的深度确定性策略梯度学习模型指导了主体学习。 仿真结果表明,使用第二种深度学习模型时,代理商在可持续性和经济目标方面的表现均明显更好。 尽管代理商没有完全的预见力或对他
1
AirSim PyTorch无人机DDQN代理
2021-09-25 20:34:28 30KB Python
1
XPlane_ML_Reinforcement_Learning_Autopilot 该项目记录了用于飞行控制的强化学习环境的设置。 这将使每个用户/学习者/学生/飞行爱好者都可以拥有自己的RL算法,该算法可以在模拟环境中与飞机互动并进行实时控制。 使用的模拟器是X-Plane (飞行环境)。 这提供了一个可与参数一起使用的真实环境,以帮助使仿真尽可能接近实际情况。 Update: Use the leaderboard wiki Page--> ( ) to add details of your own scenario or (reinforcement learning) algorithm. GYM-XPLANE ENVIRONMENT INSTALLATION To install the gym x-palne environment go through the read me file of the folder : 这是实际Gym-xplane环境的最新版本。 其他文件夹包含用于其他功能的其他模块。 此类文件夹的名称将使您了解每个此类模块的功能。 阅读
2021-09-23 14:33:38 48.59MB agent algorithm simulation xplane
1
本书与“多智能体原理与技术”互为姊妹篇。介绍多智能体机器人技术问题,深入讨论机器人群的行为计算机制。通过发布本书,我也想认识一些对这方面感兴趣的朋友,共同探讨,请与我联系,谢谢。
2021-09-22 16:25:26 5.5MB agent 多智能体 机器人 机器学习
1
Agent系统通信策略研究,陈海龙,,Agent通信策略问题是研究多Agent系统通信机制所需解决的关键性问题之一。本文首先介绍了多Agent系统的几种常见通信策略,分析了它们的
1
基于SQL Server Agent实现网站自动更新.pdf
2021-09-20 13:03:08 132KB SQL 数据库 数据处理 参考文献
基于Agent的智能楼宇集成系统的研究及设计.pdf
基于Multi-Agent协作的井下机器人智能搜救系统.pdf
全新的linux Centos7的环境下,编译安装zabbix_agent的环境rpm包,亲测可用;详细文字描述:https://blog.csdn.net/qq_36896749/article/details/80196081
2021-09-14 15:33:19 24.95MB 离线安装gcc zabbix_agent
1
Facebook 推出的一款新的iOS移动测试框架 —— WebDriverAgent。 WebDriverAgent 在 iOS 端实现了一个 WebDriver server ,借助这个 server 我们可以远程控制 iOS 设备。你可以启动、杀死应用,点击、滚动视图,或者确定页面展示是否正确。 好多人在配置和安装中存在很多问题,这里上传一个亲测可用使用的WebDriverAgent项目文件,用户只需要在WebDriverAgentLib和WebDriverAgentRunner中将Signing改为自己的开发者证书即可
2021-09-13 03:48:23 29.03MB WebDriver Agent iOS控制 iOS远程真机
1