4000多个User-Agent,适用于Python爬虫创建浏览器代理池
2021-06-15 15:04:06 394KB python
1
项目3:合作与竞争 介绍 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 下图显示了最终的奖励进度。 环境在1820集中得到解决 算法: 为了解决此环境,我实现了Multi-DDPG算法。 实现的功能如下: 每个特工都有独立的演员和评论家 集中培训:每个代理的批评者不仅将自己的演员的行为和状态作为输入,而且还将所有其他代理的状态和行为作为输入。 由于在测试过程中仅使用参与者,并且参与者仅取决于相应参与者的状态,因此代理可以自由地学习自己的奖励结构。 下图[来源: :
2021-06-09 20:21:22 45.93MB reinforcement-learning robotics tennis agents
1
Unity ML-Agents工具包 ()() Unity Machine Learning Agents工具包(ML-Agents)是一个开放源代码项目,使游戏和模拟能够用作训练智能代理的环境。 我们提供最新算法的实现(基于PyTorch),使游戏开发人员和业余爱好者可以轻松地训练2D,3D和VR / AR游戏的智能代理。 研究人员还可以使用提供的易于使用的Python API通过强化学习,模仿学习,神经进化或任何其他方法来训练Agent。 这些训练有素的代理可以用于多种目的,包括控制NPC行为(在多种设置下,例如多代理和对抗),自动测试游戏版本以及评估预发布的不同游戏设计决策。 ML-Agents工具包对游戏开发人员和AI研究人员都是互惠互利的,因为它提供了一个中央平台,可以在Unity丰富的环境中评估AI的进步,然后使更广泛的研究和游戏开发者社区都可以使用。 特征 18个以上 支
2021-06-01 15:17:37 107.98MB reinforcement-learning deep-learning unity unity3d
1
为了解决车辆转向过程中防抱死制动稳定性问题,提出multi-agents协同控制方法。首先利用黑板规则,根据转向系统和各个车轮agent状态以及整车状态进行任务协同,得到使汽车转向制动稳定的期望参考值。这些值可以自适应调节。其次在车辆伺服系统中采用改进自抗扰控制方法设计汽车纵向控制器和转向控制器,使伺服控制系统有更好的鲁棒性能进行精确跟踪期望输入命令。最后用仿真结果验证所设计的鲁棒自适应控制算法的稳定性和有效性。
1
OpenCV for Secret Agents (opencv项目开发实战),用于opencv进阶的工具书。Use OpenCV in six secret projects to augment your home, car, phone, eyesight, and any photo or drawing
2021-04-30 10:27:13 17.81MB opencv 图像处理 项目开发
1
DIET Agents是Java中的轻量级,可伸缩且健壮的多代理程序平台。 它特别适合于快速开发的P2P原型应用程序和/或使用自底向上的自然启发技术的自适应分布式应用程序。
2021-04-27 13:08:20 1.04MB 开源软件
1
多智能体中的图论方法
2021-04-23 09:04:45 5MB 多智能体 图论
1
Ml-agents 是 Unity 机器学习 Agent,它可以让研究人员和开发者用 Unity 编辑器创建游戏和仿真实验。这些编辑器能够通过简单易用的 Python API 使用强化学习或者其他机器学习模型来训练智能 Agent,github上下载不了的话可以下载这个
2021-04-22 09:07:51 59.54MB ml-agents-master unity
1
C语言
2021-04-15 17:01:41 605KB c语言 agents.h头文件
1
使用PyTorch和Unity ML-Agent进行深度Q网络(DQN)强化学习 一个简单的示例,说明如何使用PyTorch和ML-Agents环境实现基于矢量的DQN。 深度强化学习(DRL)中的Udacity Danaodgree项目 该存储库包含以下与DQN相关的文件: dqn_agent.py-> dqn-agent实现 replay_memory.py-> dqn-agent的重播缓冲区实现 model.py->用于基于向量的DQN学习的示例PyTorch神经网络 train.py->初始化并实施DQN代理的训练过程。 test.py->测试受过训练的DQN代理 根据Udacit
1