宠物小精灵-Python 这是一个用Python编写的程序,可以模拟两次神奇宝贝战斗。 现在,他能够与行动随机的敌人进行一场可玩的战斗。 另一方面,盟友的行动可以是随机的,也可以由人工智能控制。 人工智能使用强化学习技术和深度神经网络。 目录 书店 当前正在使用以下库: pygame: : keras: : 介绍 该项目致力于创建一种能够向人类学习并与他发展合作策略的AI。 安装 该代码包括一个文件,用于安装运行该程序所需的库。 在根目录中,必须执行以下指令: pip install -r requirements.txt 或者如果您想安装该软件包: python setup.py install 执行 要执行该程序,可以调用以下指令以获取有关其工作方式的更多详细信息: python run.py -h
2021-10-07 15:26:26 91.3MB python pokemon rl battle
1
MDP-DP-RL 该项目的目标是从头开始开发所有动态编程和强化学习算法(即,除了基本的numpy和scipy工具之外,不使用标准库)。 “从头开始开发”目标是出于教育目的-学习此主题的学生只有在他们开发和使用从头开始开发的代码时才能彻底理解这些概念。 我针对不同的学生背景讲授了该主题的课程,每门此类课程都以技巧/算法的精确编程实现为基础。 特别是,当我教Stanford CME 241:金融中的随机控制问题的强化学习( )时,会使用此代码库。 关于代码可读性,性能和错误的任何反馈将不胜感激,因为代码仍相当原始且未经各个部分的测试(2018年8月开始使用此代码,到目前为止主要处于代码增长模式)。 该项目开始于为有限的马尔可夫过程(又名马尔可夫链),马尔可夫奖励过程(MRP)和马尔可夫决策过程(MDP)实现基础数据结构。 其次是动态编程(DP)算法,其重点是在代码内以清晰的数学术语表
2021-10-04 12:17:47 148KB Python
1
9This project is for implementation of Q-Learning algorithm for world grid navigation
2021-09-28 18:06:34 63KB Qlearning Q-learning rockzcb www.559Rl.com
近年来,随着网络数据量的不断增加,挖掘图形数据已成为计算机科学领域的热门研究课题,在学术界和工业界都得到了广泛的研究。但是,大量的网络数据为有效分析带来了巨大的挑战。因此激发了图表示的出现,该图表示将图映射到低维向量空间中,同时保持原始图结构并支持图推理。图的有效表示的研究具有深远的理论意义和重要的现实意义,本教程将介绍图表示/网络嵌入的一些基本思想以及一些代表性模型。
2021-09-27 16:30:04 1.23MB Graph_RL
1
owl2rl-jena 一个示例项目,在Apache Jena中使用OWL2 RL规则集进行基于本体的推理。 有关更多信息,请参见。
2021-09-23 15:17:45 11KB Java
1
深度强化学习-分布式模块化框架 一个模块化框架,可实现即插即用的RL思想实验。 该系统是模块化的,具有针对演员,评论家,记忆,代理等的可重用类。 探索和学习在单独的Docker实例中作为单独的流程运行。 这样就可以运行多个分布式资源管理器。 这些组件在一个位置连接在一起,例如 , 。 急切地使用Tensorflow2。 跑 启动两个docker镜像,一个运行Explorer,另一个运行Learner。 scripts/both.sh 结果
2021-09-20 15:34:20 4.63MB JupyterNotebook
1
资源包含《Reinforcement Learning: An Introduction》两个版本英文pdf/chm电子书和部分翻译资料。
2021-09-17 21:37:15 59.73MB 强化学习 RL Sutton 教程
1
RL_deconv Richardson-Lucy 反卷积的 C++ OpenCV 实现 用法: 制作 rl_deconv image_name number_of_iterations
2021-09-17 13:08:07 12KB C
1
强化学习以及深度强化学习的四篇综述;中文论文
2021-09-10 12:15:45 3.64MB RL Deep RL
1
matlab simulink自动代码 simulink_python 使用simulink进行环境的模拟,使用python编写强化学习代码 快速开始 项目简介 tcp通信模块测试 matlab与python之间使用tcp协议进行本地阻塞式通信,matlab接收python端信息后,才能使用simulink进行模拟(目前未解决模拟步长问题)。 尝试将matlab和python分别作为客户端和服务端进行测试。其中,matlab作为客户端模拟100步时间为20s,python作为客户端模拟100步时间为2min。测试代码在。 rl模块测试 使用的是经典的模型 在调bug无果之后,准备先试试这个 尝试项目 项目缺少'svdutilitieslib' matlab,提示install 'Embedded Coder Support Package for ARM Cortex-A Processors,安装完之后发现无法打开matlab 将中文用户名修改为英文之后,问题解决,打开matlab之后发现所安装的模块没起作用,继续安装其他可能有用的模块 在服务器是部署安装matlab 找到了两篇很好
2021-08-30 10:33:59 1.22MB 系统开源
1