这是一本外国人写的关于multiagent system的书
2023-02-27 11:22:16 3.73MB agent 人工智能
1
状态:存档(代码按原样提供,预计不会更新) 多代理粒子环境 一个简单的多主体粒子世界,具有连续的观察和离散的动作空间,以及一些基本的模拟物理学。 用于中的 。 入门: 要安装,请cd进入根目录,然后键入pip install -e . 要以交互方式查看移至地标场景(请参阅./scenarios/中的其他内容),请执行以下操作: bin/interactive.py --scenario simple.py 已知依赖项:Python(3.5.4),OpenAI Gym(0.10.5),numpy(1.14.5) 要使用这些环境,请在make_env.py查看将其导入的代码。 代码结构 make_env.py :包含用于将多代理环境作为类似OpenAI Gym的对象导入的代码。 ./multiagent/environment.py :包含用于环境模拟的代码(交互物理学, _step
2022-12-01 17:13:51 32KB paper Python
1
多智能体仿真OPTIMAL CONSESNUS OF MULTIAGENT SYSTEMS USING REINFORCEMENT LEARNING APPROACH
2022-10-22 13:08:07 301KB 多智能体
1
多代理SAC 介绍 环境。 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或将球击出界外,则其获得的奖励为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性的,并且为了解决环境,您的特工必须获得+0.5的平均分数(在两个特工均取得最高分后,连续100次以上)。 具体来说, 在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个代理商的得分。 这将产生2个(可能不同)的分数。 然后,我们取这两个分数中的最大值。 这为每个情节产生一个单一的分数。 当这些分数的平均值(超过100集)至少为+0.5时,就认为环境已解决。
1
Leader-follower 算法的matlab算法实现
2022-07-25 10:09:52 3KB matlab leader-fellower
1
人工智能-机器学习-模块化机器狗Multiagent软件模型研究与设计.pdf
2022-05-19 10:07:26 2.6MB 人工智能 文档资料 机器学习
潜艇-多智能体 使用解决特定问题的多代理模拟环境的应用程序。 版本:1.0。 Sistemas Inteligentes, Grado en Ingenería Informática, Universidad de la Laguna。 阿德里安·冈萨雷斯·马丁。 联系方式: Sawan Jagdish Kapai Harpalani。 联系方式: 萨拉·马丁·莫利纳。 联系方式: 该项目受 GNU 许可。 项目介绍 每艘潜艇都是一个代理,将从所有潜艇被释放的地方进行处理,并前往指定的区域开始探索。 在开始模拟之前,用户可以添加障碍物形状的岛屿,使潜艇的工作复杂化。 漏油也是一种出现在地图随机区域并开始向随机方向移动太慢的代理。 如果漏油击中一个岛或靠在墙上,它将在该点停止其运动。 如果您在没有潜艇的情况下花费一段时间发现泄漏将允许每个特工可以在您所在区域之外进行探索。 这在
2022-03-30 22:47:22 3.73MB NetLogo
1
学习深度学习和强化学的人
2021-12-14 19:06:27 236KB AI machinelearning
1
MPE-多主体强化学习算法 MPE 这是使用OpenAI Multi-Agent RL的简单验证实验代码。 该环境总结了许多基准,并最初为算法做准备。 由于环境设置简单, MPE似乎是验证我们新的Multi-Agent RL算法并与其他基准进行比较的良好玩具实验环境。 我为您编写了一些著名的多主体RL算法,以便您可以更改较少的代码来实现自己的算法并验证实验结果。 笔记: 如果要成功运行此MPE环境,则必须确保已下载 。 但是,我已经将基准的文件推送到项目中,如果您发现从OpenAI下载的基准有任何问题,则可以使用我的文件。 要求 Python> = 3.6.0 PyTorch == 1.2.0 OpenAI体育馆== 0.10.5 演算法 待办事项清单 评估和渲染 数字与比较 上传训练模型.pt 致谢 我一直以硕士生的身份学习。 我的代码和对算法的理解可能存在一些问
2021-11-23 10:03:43 3.62MB Python
1
An Introduction To Multiagent Systems
2021-11-19 10:33:04 21.84MB An Introduction To Multiagent
1