布鲁克林Bang Bang
在学生中进行项目/竞赛的设置,以训练经典游戏Bomberman的获奖强化学习代理。
方法
简单神经网络方法
( 是基于的代理
罗莎·迪亚兹(Rosa Diaz)
杰克·佩拉尔塔(Jake Peralta)
Github动作
培训代理商可能会令人讨厌。为了简化我们的工作,我们集成了一个Github Action来自动培训我们的代理商。可悲的是,我的服务器没有图形卡,因此我们仍然使用CPU进行训练。好吧,我并不富有:D
使用映像运行 :
docker run -it --name github-runner \
-e RUNNER_NAME=private \
-e GITHUB_ACCESS_TOKEN=... \
-e RUNNER_TOKEN=... \
-e RUNNER_REPOSITORY_URL=https://gi
1