该AI程序实现了多个AI代理来播放Flappy Bird。该计划应用强化学习技术,包括SARSA,Q学习和函数逼近。经过10,000次迭代的训练后,特工经常获得1400+的高分,最高游戏得分2069
该项目需要以下框架:
Pygame:https://www.pygame.org
PyGame学习环境:https://github.com/ntasfi/PyGame-Learning-Environment
OpenAI体育馆:https ://gym.openai.com
Gy-ple:https : //github.com/lusob/gym-ple
PyTorch:https://pytorch.org
OpenCV:https://opencv.org
2021-10-16 14:43:06
23KB
AI程序
1