#GridWorld ##简介        GridWorld案例提供了一个图形化环境用于可视化对象在二维网格中的交互。在这个案例中,你将设计和制造各种Actor的对象,将它们添加到一个网格中,并且根据一定的规则决定Actor的行为。此外我们还增加了三个扩展任务,ImageReader、N-Puzzle(华容道)和MazeBug(迷宫)。ImageReader实验要求参训学生利用本实验软装置,实现一个利用二进制流读取Bitmap图像,并且能够进行简单地处理和保存的软件;N-Puzzle实验要求参训学生利用广度优先搜索算法和启发式搜索算法完成重拼图游戏;MazeBug实验要参训学生采用深度优先搜索算法就可以走出迷宫。此项目要求参训学生在短时间内自学新的程序设计语言和相关工具,可以训练参训学生的快速学习的能力。通过此项目实训能让参训学生掌握在Linux环境下进行代码编写、程序调试和测试的基本
2022-11-25 23:21:28 110.24MB Ruby
1
L2M_GridWorld 网格世界设置中的终身学习,基于以下文章中的Mini网格世界环境: : 第一次运行:运行此命令:python ./manual_control.py --env MiniGrid-FourRooms-v0 --num_envs 5 简约的Gridworld环境(MiniGrid) 那里还有其他的gridworld Gym环境,但是该环境被设计为特别简单,轻巧和快速。 该代码几乎没有依赖项,因此不太可能破坏或无法安装。 它不加载任何外部精灵/纹理,并且可以在Core i7笔记本电脑上以高达5000 FPS的速度运行,这意味着您可以更快地运行实验。 可以找到有效的RL实现。 要求: Python 3.5+ OpenAI体育馆 NumPy Matplotlib(可选,仅用于显示) 如果要在出版物中引用此存储库,请使用此bibtex: @misc{g
2021-12-23 12:07:12 6.37MB Python
1
GridWorld(计划和强化学习) 包含用于规划的算法:策略迭代和价值迭代。 还包含强化学习算法:蒙特卡洛学习,Sarsa(lambda)和Q学习。 在GridWorld问题的上下文中使用这些方法,在该问题中,代理的目标是找到到达终端状态的最快路径。 game.py文件包含Grid World环境。 可以运行其他文件来执行强化学习或计划(取决于所选文件)。
2021-12-22 11:53:22 7KB Python
1
网格世界 使用强化学习技术、值迭代和 Q 学习解决 5x4 网格世界问题
2021-12-22 11:49:30 4KB Java
1
百度飞桨世界冠军带你从零实践到强化学习第二天博客使用文件,如果文件收费请联系,帮助修改额度(免费的!!!)
2021-12-22 10:53:26 7KB 深度学习
1
经典的 迷宫般的问题代理生活在网格墙块代理的路径噪音运动:行动并不总是按照计划80%时间,行动北代理北(如果没有墙)10%时间,北把代理西方;10%东如果有一堵墙的方向代理会采取,代理保持把代理每步收到奖励小“生活”奖励每一步(可以是负面)大回报来结束(好或坏)目标:最大化回报的总和
2021-05-30 14:02:05 3KB matlab 深度学习 gridworld