只为小站
首页
域名查询
文件下载
登录
PacmanRL:应用于 Pacman 游戏的
强化学习
算法
吃豆子RL 应用于 Pacman 游戏的
强化学习
算法。 Pacman 游戏是为 Udacity 类 ud820的结果。 可以在qlearningAgents.py文件中找到学习器。 跑步 python pacman.py -p PacmanQAgent -x 800 -n 810 -l smallGrid -l参数可以更改为使用其他地图(在布局文件夹中可用)。 -p参数可以更改为使用其他类型的 q-learner。 -x设置训练示例的数量。 -n设置示例总数(训练 + 测试) 学习者 PacmanQAgent:基本的 Q 学习代理。 它使用完整状态(整个地图),因此在使用大地图时不会缩放。 运行: python pacman.py -g DirectionalGhost -p PacmanQAgent -x 800 -n 810 -l smallGrid Approxi
2022-04-11 10:00:26
83KB
Python
1
Reinforcement Learning - An Introduction 2nd 2017 6月版
Reinforcement Learning: An Introduction Richard S. Sutton and Andrew G. Barto Second Edition, in progress MIT Press, Cambridge, MA, 2017
2022-04-07 21:00:55
10.67MB
强化学习
1
基于倒立摆系统的
最优控制
理论研究
通过状态空间表达式的推导,从数学模型中倒立摆系统的建立,来研究探讨其系统的能观性、稳定性和能控性,并利用线性二次型最优调节器(LQR)对倒立摆系统进行控制。MATLAB仿真结构表明,使用LQR控制方法对系统进行控制,能满足系统稳定性、鲁棒性要求。
2022-04-07 02:00:54
273KB
线性二次型最优调节器
倒立摆
最优控制理论
1
rlgraph:RLgraph:用于深度
强化学习
的模块化计算图
RL图 用于深度
强化学习
的模块化计算图。 RLgraph是一个在研究和实践中快速原型化,定义和执行
强化学习
算法的框架。 RLgraph与大多数其他库不同,因为它可以支持TensorFlow(或通常的静态图),也可以通过单个组件接口支持急切/按运行定义执行(PyTorch)。 您还可以在此处找到介绍性博文: 。 RLgraph公开了使用代理的良好定义的API,并提供了用于测试和组装机器学习模型的新颖组件概念。 通过分离图定义,编译和执行,无需修改代理定义即可访问多个分布式后端和设备执行策略。 这意味着它特别适合从应用用例原型到大规模分布式培训的平稳过渡。 版本0.4.0中RLgraph的
2022-04-06 21:52:00
1.88MB
machine-learning
reinforcement-learning
deep-learning
tensorflow
1
强化学习
算法笔记整理和总结
里面是我自己的
强化学习
笔记。参考自刘建平老师的
强化学习
博客,再加上自己的理解,通俗易懂。里面包含了
强化学习
model-free的经典论文(Q-learning、SARSA、TD(lambda)、DQN、DDQN、prioritized replay DQN、Dueling DQN、policy gradient、AC、A2C、A3C、DDPG、TD3、TRPO、PPO),能帮助你快速入门
强化学习
。除了有算法的公式,还有我自己的理解,以及要理解算法所需要的一些基础知识,算法的流程图,都写在了里面,绝对生动形象,通俗易懂。
2022-04-06 14:08:57
102.54MB
算法
强化学习
机器学习
最优控制
1
人工智能_项目实践_
强化学习
_基于
强化学习
的五子棋
人工智能_项目实践_
强化学习
_基于
强化学习
的五子棋
2022-04-06 03:11:07
85.06MB
人工智能
强化学习
五子棋
深度学习之
强化学习
.pdf
深度学习之
强化学习
.pdf
2022-04-06 03:11:03
2.2MB
深度学习
人工智能
用matlab自主搭建DQN算法解决CartPole问题
本项目采用MATLAB语言搭建cartPole问题环境以及手动实现DQN算法能够很好的解决控制小车的平衡一类问题,其目的是帮助初学者很好地理解DQN算法。
2022-04-06 03:10:36
4KB
matlab
算法
开发语言
强化学习
HUAWEI(华为) atlas 200 DK环境配置方法、网络配置、例程速跑及
强化学习
示例 昇腾代码仓使用 MobaXterm
HUAWEI(华为) atlas 200 DK环境配置方法、网络配置、例程速跑及
强化学习
示例 内容涵盖华为Atals基本配置、昇腾华为Atals代码仓使用示例、MobaXterm使用示例等说明。 前言: ① 本文主要部分参考Atlas 200 DK开发者套件官方文档等资料。 ② 本文在官方环境部署的基础上简化了有读卡器情形下的制卡过程,更方便部署。 ③ 本文通过学习者的视角,对每一步操作进行了细致的解读并着重介绍了终端工具MobaXterm软件的相关使用方法,适用于方便地管理文件和传输文件,对初学者更为友好。 ④ 本文为学习笔记及说明书类学习资料。
2022-04-06 00:38:35
2.95MB
华为
Atlas200DK
MobaXterm
1
多
值函数
插值:对多
值函数
进行有意义的插值-matlab开发
对多
值函数
进行插值时(每个 x 超过一个 y), interp1 最多会产生错误(如果 x 数据相同),最坏会产生垃圾(见附图)。 当逆 (x = g(y)) 是一个明确定义的函数时,此函数执行多
值函数
的有意义的插值。 对于每个插值点, interp1Multivalued 返回存在于输入 x 和 y 向量中定义的每个分支上的插值 y。
2022-04-05 16:10:18
672B
matlab
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
中国地面气候资料日值数据集(V3.0)2010-2019.rar
基于STM32的电子时钟设计
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
鲸鱼优化算法 WOA matlab源代码(详细注释)
JPEG的Matlab实现
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
SSM外文文献和翻译(毕设论文精品).doc
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
数字图像处理[冈萨雷斯]
Plex v7.12电视端app
quartus II13.0器件库.zip
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
多目标优化算法(四)NSGA3的代码(python3.6)
最新下载
面向对象分析与设计习题及部分答案
2024年一线大厂Java面试题及详细讲解(含代码示例)
零基础DSP实战TMS320F28035:第十节,DSP之CLA内核应用实战.zip
CLA实现无刷电机控制(可以运行的CODE)
STM32G031C8T6无线温湿度开源项目.rar
ASSA和STW脚本代码解密绿色免费版
MFC西南交大计图实验-2D绘图工具设计
基于FPGA的振动信号采集卡的研究与设计-论文
抓包工具MessageAnalyzer
基于蚁群算法的旅行商问题(TSP)求解(matlab实现)
其他资源
分形 张济忠 著 高清!
12位ADC的Multisim仿真原理图
黑苹果EFI合集
幼儿园管理系统
ch340t封装文件
IE7绿色版 for win7
二叉树遍历实验报告
三菱PLC十字路口红绿灯程序
karel(中文版本)
具体数学 习题解析 第一节
根据update语句自动生成select语句
max31865数据手册与spi模拟程序
一套完整的门禁系统(原理图+源程序)
Java 虚拟机面试题全面解析(干货)
Inoryww-源码
hpux-小机巡检命令列表及说明.pdf
SVT:A Singular Value Thresholding Algorithm For Matrix Completion.pdf
Photolemur 3.1 全新自动化图片处理工具.rar
数码管、点阵 拨动开关 拨码开关Altium封装 AD封装库 2D+3D PCB封装库-28MB.zip
hslogic算法仿真-维特比译码
HKSI Paper 1 60个温习重点.pdf
.net办公系统开发OA源码带视频
ASP.NET 学生信息管理系统 整站 带数据库 源代码系统
java实现全屏自动播放图片
场景流经典教材
图书管理系统jsp源代码
The Spin Model Checker_Primer and Reference Manual (PDF格式)
android做的俄罗斯方块