Unity ML-Agents工具包 ()() Unity Machine Learning Agents工具包(ML-Agents)是一个开放源代码项目,使游戏和模拟能够用作训练智能代理的环境。 我们提供最新算法的实现(基于PyTorch),使游戏开发人员和业余爱好者可以轻松地训练2D,3D和VR / AR游戏的智能代理。 研究人员还可以使用提供的易于使用的Python API通过强化学习,模仿学习,神经进化或任何其他方法来训练Agent。 这些训练有素的代理可以用于多种目的,包括控制NPC行为(在多种设置下,例如多代理和对抗),自动测试游戏版本以及评估预发布的不同游戏设计决策。 ML-Agents工具包对游戏开发人员和AI研究人员都是互惠互利的,因为它提供了一个中央平台,可以在Unity丰富的环境中评估AI的进步,然后使更广泛的研究和游戏开发者社区都可以使用。 特征 18个以上 支
2021-06-01 15:17:37 107.98MB reinforcement-learning deep-learning unity unity3d
1
对论文《Human-level control through deep reinforcement》的中文翻译的文档
2021-05-29 21:41:52 2.56MB 强化学习 DQN Atari2600 神经网络
1
强化学习 作为我的论文的最后部分,“协作多智能体学习的方法和实现”,涉及从单一智能体到多智能体的RL研究,以及协作和协作多智能体学习的最新技术。的算法和实现,在MATLAB中完成了某些RL方法的实现。 论文论文也被上传,其中包含参考文献。 单人强化学习 动态编程 蒙特卡洛方法 时差学习 线性函数逼近 深度Q网络 具有线性函数逼近的策略梯度 多智能体强化学习 集中式Q学习 滞后Q学习 多代理演员批评
2021-05-22 13:16:32 4.39MB MATLAB
1
This practical guide will teach you how deep learning (DL) can be used to solve complex real-world problems.
2021-05-16 22:23:10 7.22MB Deep Learning Reinforcement le
1
Chatbot_CN:基于金融-司法领域(兼有闲聊性质)的聊天机器人,其中的主要模块有信息抽取,NLU,NLG,知识图谱等,并利用Django整合了前端展示,目前已经封装了nlp和kg的restful接口
1
扑克RL 扑克游戏中的多智能体深度强化学习框架。 背景 解决不完善的信息游戏的研究主要围绕直到最近才遍历整个游戏树的方法(例如,请参见 , , )。 神经虚拟自我播放(NFSP) ,后悔策略梯度(RPG) ,深反事实后悔最小化(Deep CFR) 和单深CFR 等新算法最近将深(强化)使用常规方法(例如CFR和虚拟游戏)进行学习,以仅在访问游戏状态的一小部分时即可了解近似的纳什均衡。 PokerRL框架 PokerRL算法的组成部分 您的算法由相互交互的工作人员(绿色)组成。 训练运行的参数通过TrainingProfile的实例( .../rl/base_cls/Training
2021-05-12 11:04:25 325KB framework research reinforcement-learning poker
1
sumo_reinforcement_learning:与斯坦福大学机器学习课程(CS 229)的最终项目相关的源代码; 在SUMO交通模拟环境中使用强化学习方法
2021-05-11 09:58:14 2.37MB 系统开源
1
Reinforcement Learning - An Introduction,Richard S. Sutton著作,第二版,2018年3月25日版本,是目前最新的版本,548页
2021-05-10 17:22:40 16.15MB 强化学习
1
多代理深确定性策略梯度 多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现 这是我在论文中提出的算法的实现:“针对混合合作竞争环境的多主体Actor评论家”。 您可以在这里找到本文: : 您将需要安装多代理粒子环境(MAPE),可以在这里找到: : 确保创建具有MAPE依赖项的虚拟环境,因为它们有些过时了。 我还建议使用PyTorch 1.4.0版运行此程序,因为最新版本(1.8)似乎与我在计算批评者损失时使用的就地操作存在问题。 将主存储库克隆到与MAPE相同的目录中可能是最容易的,因为主文件需要该软件包中的make_env函数。 可以在以下位置找到本教程的视频: :
1
用强化学习进行路径规划,各种强化学习的算法,适合从一开始进行学习,加实践代码哦
2021-05-07 11:48:22 11.6MB 强化学习 python 路径规划
1