#PSRToolbox
作者:William L Hamilton(以前是麦吉尔大学,推理与学习实验室,现为斯坦福大学)联系人:
注意:我不再积极维护此存储库,但是我欢迎有兴趣使用该代码的人员提出咨询。
描述
使用PSR对动力学系统建模和构建基于模型的强化学习算法的方法和工具的集合。 PSR代码可选地使用随机压缩技术来提高性能(所谓的“压缩预测状态表示”)。 有关详细信息,请参见arXiv:1312.0286 [cs.LG]上的论文“具有压缩预测状态的有效学习和规划”。 提供的Java文档也应该有所帮助。
注意:目前,我正在将大多数代码转移到其他语言(例如,C ++表示速度,Python表示可用性)。 因此,我将不会定期进行此回购。 如果您有特定问题,请给我发电子邮件。
免责声明:该代码既具有完整功能,也正在进行中(与大多数研究代码一样)。 因此,我不能保证特定的功能。 此外,该
2022-11-11 20:51:28
10.03MB
Java
1