现阶段网络上的五子棋游戏主要是剪枝法或者人工标注,这样导致了机器落子具有了局限性,遇到全新的棋形时无法正确落子。基于上面五子棋游戏的漏洞,本文设计一学习型五子棋博弈算法,算法通过深度学习和蒙特卡洛树搜索算法打破既定规则,提高了机器在下棋时的多变性。该软件使用的神经网络将我方落子、敌方落子、当前落子位置以及当前落子玩家,四个矩阵作为输入数据,加强了网络提取特征的速度和拟合效率,并获取每个点的概率值。在蒙特卡洛树搜索算法中使用了快速落子方式,即标注出多个关键点的价值,使得在模拟时,不需要在无胜算的地方随机落子,通过这种方法可以提高落子效率。该算法经过一定规模的训练达到了较好的博弈水平。本软件优点在于,通过使用蒙特卡洛树搜索算法让计算机可以不再依靠人类创造的落子策略,使用深度学习可以加快运算出蒙特卡洛概率值,提高整体游戏落子速度。该算法建立在深度学习的相关知识和计算机博弈的相关知识基础上,实现了基于深度学习与蒙特卡洛树搜索的五子棋博弈算法,并设计出卷积网络接口net。
1