只为小站
首页
域名查询
文件下载
登录
【4000+ User-
Agents
】
4000多个User-Agent,适用于Python爬虫创建浏览器代理池
2021-06-15 15:04:06
394KB
python
1
带有MADDPG的网球:在Pytorch上实现MADDPG-源码
项目3:合作与竞争 介绍 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 下图显示了最终的奖励进度。 环境在1820集中得到解决 算法: 为了解决此环境,我实现了Multi-DDPG算法。 实现的功能如下: 每个特工都有独立的演员和评论家 集中培训:每个代理的批评者不仅将自己的演员的行为和状态作为输入,而且还将所有其他代理的状态和行为作为输入。 由于在测试过程中仅使用参与者,并且参与者仅取决于相应参与者的状态,因此代理可以自由地学习自己的奖励结构。 下图[来源: :
2021-06-09 20:21:22
45.93MB
reinforcement-learning
robotics
tennis
agents
1
ml-
agents
:Unity机器学习代理工具包
Unity ML-
Agents
工具包 ()() Unity Machine Learning
Agents
工具包(ML-
Agents
)是一个开放源代码项目,使游戏和模拟能够用作训练智能代理的环境。 我们提供最新算法的实现(基于PyTorch),使游戏开发人员和业余爱好者可以轻松地训练2D,3D和VR / AR游戏的智能代理。 研究人员还可以使用提供的易于使用的Python API通过强化学习,模仿学习,神经进化或任何其他方法来训练Agent。 这些训练有素的代理可以用于多种目的,包括控制NPC行为(在多种设置下,例如多代理和对抗),自动测试游戏版本以及评估预发布的不同游戏设计决策。 ML-
Agents
工具包对游戏开发人员和AI研究人员都是互惠互利的,因为它提供了一个中央平台,可以在Unity丰富的环境中评估AI的进步,然后使更广泛的研究和游戏开发者社区都可以使用。 特征 18个以上 支
2021-06-01 15:17:37
107.98MB
reinforcement-learning
deep-learning
unity
unity3d
1
基于
agents
系统的汽车转向制动稳定协同控制
为了解决车辆转向过程中防抱死制动稳定性问题,提出multi-
agents
协同控制方法。首先利用黑板规则,根据转向系统和各个车轮agent状态以及整车状态进行任务协同,得到使汽车转向制动稳定的期望参考值。这些值可以自适应调节。其次在车辆伺服系统中采用改进自抗扰控制方法设计汽车纵向控制器和转向控制器,使伺服控制系统有更好的鲁棒性能进行精确跟踪期望输入命令。最后用仿真结果验证所设计的鲁棒自适应控制算法的稳定性和有效性。
2021-05-07 11:02:02
446KB
汽车集成控制
转向制动稳定
multi-agents系统
自抗扰控制
1
OpenCV for Secret
Agents
(opencv项目开发实战)
OpenCV for Secret
Agents
(opencv项目开发实战),用于opencv进阶的工具书。Use OpenCV in six secret projects to augment your home, car, phone, eyesight, and any photo or drawing
2021-04-30 10:27:13
17.81MB
opencv
图像处理
项目开发
1
DIET
Agents
-开源
DIET
Agents
是Java中的轻量级,可伸缩且健壮的多代理程序平台。 它特别适合于快速开发的P2P原型应用程序和/或使用自底向上的自然启发技术的自适应分布式应用程序。
2021-04-27 13:08:20
1.04MB
开源软件
1
Graph Theory in Mutli-
Agents
.zip
多智能体中的图论方法
2021-04-23 09:04:45
5MB
多智能体
图论
1
ml-
agents
-master
Ml-
agents
是 Unity 机器学习 Agent,它可以让研究人员和开发者用 Unity 编辑器创建游戏和仿真实验。这些编辑器能够通过简单易用的 Python API 使用强化学习或者其他机器学习模型来训练智能 Agent,github上下载不了的话可以下载这个
2021-04-22 09:07:51
59.54MB
ml-agents-master
unity
1
agents
.h头文件
C语言
2021-04-15 17:01:41
605KB
c语言
agents.h头文件
1
DQN-using-PyTorch和ML-
Agents
:如何使用PyTorch和ML-
Agents
环境实现基于矢量的DQN的简单示例-源码
使用PyTorch和Unity ML-Agent进行深度Q网络(DQN)强化学习 一个简单的示例,说明如何使用PyTorch和ML-
Agents
环境实现基于矢量的DQN。 深度强化学习(DRL)中的Udacity Danaodgree项目 该存储库包含以下与DQN相关的文件: dqn_agent.py-> dqn-agent实现 replay_memory.py-> dqn-agent的重播缓冲区实现 model.py->用于基于向量的DQN学习的示例PyTorch神经网络 train.py->初始化并实施DQN代理的训练过程。 test.py->测试受过训练的DQN代理 根据Udacit
2021-04-10 16:10:27
2.72MB
reinforcement-learning
unity
deep-reinforcement-learning
pytorch
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于VMD算法的信号降噪.rar
粒子群算法优化3-5-3多项式工业机器人时间最优轨迹规划算法matlab代码
Alternative A2DP Driver 1.0.5.1 无限制版
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
C4.5决策树算法的Python代码和数据样本
全国道路网SHP数据.zip
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
Vivado license 永久
python爬虫数据可视化分析大作业.zip
Steam离线安装版
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
大学生网页设计大作业-5个网页设计制作作品自己任选
中小型企业网络建设.pkt
最新下载
The Object Primer, Third Edition
chrome谷歌浏览器离线安装包,版本124.0.6367.208
技嘉主板h61-ds2 v2.2网吧版bios f9
技嘉H61M-DS2REV2.2 F9 BIOS
H61M-DS2 REV2.1 BIOS
源码篇:c语言课设-校园跳蚤市场
Flexlm_sdk_11.9_x64
Delphi获取拼音首字母,包含生僻字和多音字
gdal-release.aar
iPhone3,3-6.1.3shsh
其他资源
QT、C++ 米其林自助点餐系统
象棋小虫版.rar小虫象棋2010年版本
随机相位正弦波仿真实验MATLAB程序
R软件及其在金融定量分析中的应用-教学课件
可视密码的matlab实现,附带展示ppt
利用Python绘制3D玫瑰花
学生点名系统
智能无线遥控门铃设计(内含原理图、PCB、源代码、实物照片)
读取srtm高程影像tif格式,获取它的高程
基于SQLserver的学生选课系统
vs连接postgre示例
用户管理模块的概要设计
来自麻省理工的正则化最小二乘法讲义
由入门到精通-吃透PID2.0版
lemon-core:Lemonless无服务器微服务平台-源码
PCHD系统的参数镇定
DataCleaner:首要的开源数据质量解决方案-源码
vb中使用TeeChart控件
绿色便携版 卡西欧计算器
ad元件库文件
利用MFC编写一个简单的带界面的数据库
DataGrid动态绑定XML文件
pyexcel技术文档
okhttp3(包含http-3.9.0.jar和okio1.13.0.jar)
《计算机图形学VC》源代码