OpenSpiel:游戏中强化学习的框架
OpenSpiel是用于一般强化学习和游戏中搜索/计划研究的环境和算法的集合。 OpenSpiel支持n玩家(单人和多人)零和,合作和一般和,单发和顺序,严格的回合和同时移动,完美和不完美的信息游戏,以及传统的多人环境例如(部分和完全可观察的)网格世界和社会困境。 OpenSpiel还包括用于分析学习动态和其他常见评估指标的工具。 游戏被表示为程序扩展形式的游戏,具有一些自然的扩展。 核心API和游戏以C ++实现,并公开给Python。 算法和工具都是用C ++和Python编写的。 swift子目录中还有一个纯Swift分支。
要在Google Colaboratory中尝试OpenSpiel,请参考open_spiel/colabs子目录或从开始。
指数
请在以下选项中选择:
有关核心概念,形式主义和术语的较长介绍,包括算法概述和一些结果,请参阅《 。
有关OpenSpiel的概述以及核心API的示例用法,请参见教程演示幻灯片: 。
如果您在研究中使用OpenSpiel,请使用以下BibTeX引用该论文:
@article{
1