布鲁克林Bang Bang 在学生中进行项目/竞赛的设置,以训练经典游戏Bomberman的获奖强化学习代理。 方法 简单神经网络方法 ( 是基于的代理 罗莎·迪亚兹(Rosa Diaz) 杰克·佩拉尔塔(Jake Peralta) Github动作 培训代理商可能会令人讨厌。为了简化我们的工作,我们集成了一个Github Action来自动培训我们的代理商。可悲的是,我的服务器没有图形卡,因此我们仍然使用CPU进行训练。好吧,我并不富有:D 使用映像运行 : docker run -it --name github-runner \ -e RUNNER_NAME=private \ -e GITHUB_ACCESS_TOKEN=... \ -e RUNNER_TOKEN=... \ -e RUNNER_REPOSITORY_URL=https://gi
1