L2M_GridWorld 网格世界设置中的终身学习,基于以下文章中的Mini网格世界环境: : 第一次运行:运行此命令:python ./manual_control.py --env MiniGrid-FourRooms-v0 --num_envs 5 简约的Gridworld环境(MiniGrid) 那里还有其他的gridworld Gym环境,但是该环境被设计为特别简单,轻巧和快速。 该代码几乎没有依赖项,因此不太可能破坏或无法安装。 它不加载任何外部精灵/纹理,并且可以在Core i7笔记本电脑上以高达5000 FPS的速度运行,这意味着您可以更快地运行实验。 可以找到有效的RL实现。 要求: Python 3.5+ OpenAI体育馆 NumPy Matplotlib(可选,仅用于显示) 如果要在出版物中引用此存储库,请使用此bibtex: @misc{g
2021-12-23 12:07:12 6.37MB Python
1
人和高级动物在整个生命中不断获取、微调和转让知识和技能。这种能力,称为lifelong learning,是由一系列神经认知机制协调的过程,这些机制共同促进了sensorimotor技能的发展以及对长期记忆的巩固和检索。因此对于计算系统和自动化智体,lifelong learning能力,对能否在现实世界进行交互并处理连续信息,至关重要。
2021-05-21 13:06:16 1.48MB 终身学习
1
自我学习:机器学习里最有挑战的部分1 AlphaGo的原理 2如何做一个AlphaGo?一个能根据环境变化采取正确策略的智能体 3其他前沿话题:迁移学习,终身学习4学习总结
2021-05-04 14:07:25 13.18MB 机器学习 深度学习 迁移学习 终身学习