参考资料,https://zhuanlan.zhihu.com/p/32089487,本实现参考借鉴了该资源,本实现的立体四子棋为落子有限制版的立体四子棋(qubic),必须先下下层的棋子,上层的相关棋子才能继续落子,经过3500次的训练,ai水平基本可以了,模型为best_policy.model,python human_play.py即可对战。训练使用python train.py. python版本2
2023-01-03 15:29:42 1.95MB 立体四子棋 深度学习 强化学习 alphazero
1
基于AlphaZero的五子棋AI,仅用于学习交流,请勿用于商业用途和其他用途。如需用于非学习交流用途,请先私信联系我。
2022-11-07 23:16:23 34.78MB AlphaZero 五子棋 人工智能 蒙特卡洛
1
AlphaZero 的 Rust 实现 这个 repo 是一个由多个 crate 和二进制文件组成的货物工作空间: synthesis: 包含所有主要训练和 MCTS 逻辑的主库 crate study-connect4: 使用综合库训练网络玩 Connect4 的二进制 crate base65536: 一个小箱子,用于将 u8 编码/解码为有效的 utf-8 字符串 slimnn: 一个纯锈的小型神经网络板条箱 export: 一个将pytorch权重保存为slimnn可以理解的格式的二进制包 实施了什么 与 tch-rs [1] 包集成以在 rust 中支持 pytorch 支持标准推出方法以及使用 NN 代替推出的通用 MCTS 实现 包括 MCTS 求解器 [2] 包括 FPU [3] 一个使用 MCTS+NN 收集经验并训练策略和价值函数的 AlphaZero [4] 学习器 支持多个价值目标 所有超参数暴露 多线程支持! 针对具有各种探索次数的标准部署 mct 进行轻量级评估 将游戏结果保存到 pgn 文件 运行 bayeselo [
2022-06-11 14:03:31 44KB rust 算法
这个包提供了Deepmind 的 AlphaZero 算法的通用、简单和快速的实现: 核心算法只有 2000 行纯的、可破解的 Julia 代码。 通用界面可以轻松添加对新游戏或新学习框架的支持。 这种实现比用 Python 编写的竞争替代方案快一到两个数量级,可以在带有 GPU 的标准台式计算机上解决非平凡的游戏。 可以像在单台计算机上一样轻松地在一组机器上训练相同的代理 ,而无需修改一行代码。 我为什么要关心 AlphaZero? 除了广为人知的在国际象棋和围棋等游戏中达到超人水平的成功之外,DeepMind 的 AlphaZero 算法还展示了一种更通用的方法,将学习和搜索相结合,以有效地探索大型组合空间。我们相信这种方法可以在许多不同的研究领域有令人兴奋的应用。 我为什么要关心这个实现? 由于 AlphaZero 需要大量资源,因此成功的开源实现(例如Leela Zero)是用低级语言(例如 C++)编写的,并针对高度分布式计算环境进行了优化。这使得学生、研究人员和黑客很难接触到它们。 该项目的动机是提供 AlphaZero 的实现,该实现足够简单,可以广泛访问,同时也
2022-06-10 10:03:29 6.63MB 算法
MuZero与Tensorflow中的AlphaZero 我们提供了基于流行的AlphaZero-General实施的AlphaZero和MuZero算法的可读性,注释性,充分记录的以及概念上容易实现的算法。 我们的实现将AlphaZero扩展为可用于单人游戏域,例如其后续产品MuZero。 该代码库提供了一个模块化框架来设计您自己的AlphaZero和MuZero模型,以及一个API来使这两种算法相互抵触。 该API还允许MuZero代理在与环境交互过程中更加强烈地依赖其学习的模型。 程序员可以例如指定在试验期间对所学的MuZero代理的观察稀疏性。 我们的界面还提供了足够的抽象来扩展MuZero或AlphaZero算法,以用于研究目的。 请注意,我们没有在桌游上进行广泛的测试,我们体验到这非常耗时且难以调整。 经过良好测试的环境包括“健身房”环境:CartPole-v1,Mount
1
中国象棋Zero(CCZero) 关于 通过方法进行中国象棋强化学习。 该项目基于以下主要资源: DeepMind于10月19日发布的文章: 。 @ mokemokechicken / @ Akababa / @ TDteach在其回购中所做的DeepMind创意的伟大的黑白棋/象棋/中国象棋开发: : : , 带GUI的中国象棋引擎: : 帮助训练 为了使用与AlphaZero相同的技术类型来构建强大的中国象棋AI,我们需要使用分布式项目来完成此任务,因为它需要大量的计算。 如果您想加入我们,打造世界上最好的中国象棋AI: 有关说明,请参见 有关实时状态,请参见 环境
1
AlphaZero五子棋 AlphaZero的多线程实现 特征 自由式五子棋 具有虚拟损失/ LibTorch的树/根并行化 Gomoku和MCTS用C ++编写 SWIG wrap C ++扩展 更新2019.7.10:支持Ubuntu和Windows 精氨酸 编辑config.py 环境 Python 3.6+ PyGame 1.9以上 PyTorch 1.0+ LibTorch 1.0+ MSVC14.0 / GCC6.0 + CMake 3.8以上 SWIG 3.0.12+ 跑步 # Add LibTorch/SWIG to environment variable $PATH # Compile Python extension mkdir build cd build cmake .. -DCMAKE_PREFIX_PATH=path/to/libtorch -DCMA
2021-11-26 14:30:13 3.52MB multi-threading parallel pytorch gomoku
1
配合文章https://blog.csdn.net/askmeaskyou/article/details/108993981 的完整代码。AlphaZero技术实现的五子棋游戏,使用Tensorflow2实现神经网络,包含自对弈训练网络的Python代码但是没有训练好的模型,需要自己训练。单机训练需要的时间可能是按年计算(大约3700年)......当作教学代码阅读比较合适。
1
手把手教你搭建AlphaZero(使用Python和Keras).pdf
2021-08-17 09:13:50 1.9MB alphazero
1
谷歌论文详解AlphaZero:为国际象棋、将棋与围棋带来新曙光.pdf
2021-08-17 09:13:49 809KB alphazero
1