象棋
该项目的报告在pdf文件中(用法语编写)。 我编写了Shogi引擎部分以及MCTS和神经网络部分。
该项目旨在设计与DeepMind的AlphaZero相同模型的AI演奏将棋。 AlphaZero是一款能够玩围棋,象棋和将棋的AI,并且达到了超人的性能。 它结合了蒙特卡洛树搜索和神经网络,并通过自身操作以无监督的方式进行训练。 它只知道游戏规则,而没有其他先验知识。 AI只能通过自学来学习策略。
Shogi文件夹包含两个AI:A0Jr和SNN。
A0Jr是AlphaZero模型上的AI。 目的只是使AI能够做出连贯的动作。 但是我的计算能力太低,无法训练模型甚至无法达到这个中等目标(即使使用Google Colab的GPU)。
这就是为什么我然后尝试仅使用神经网络而不使用蒙特卡洛树搜索来设计一个更简单的模型的原因。 该模型位于文件夹SNN(简单神经网络)中。 我使用了几种技巧
2021-04-29 10:38:59
10.08MB
Python
1