设置
该项目使用rust(夜间频道)python和tensorflow.
安装rustup并启动rustup default nightly以启用夜间编译器。
安装tensorflow以启用 PUCT/AlphaZero/MuZero 策略。
更一般地说,用于pip install -r requirements.txt安装 python 依赖项(tensorflow被排除在列表之外tensorflow)tensorflow-gpu。
用法
Cargo是 Rust 项目经理。用于cargo run --release --bin 执行二进制文件。可用的二进制文件有:
evaluate:评估两项突破政策
ui: 检查 alphazero 的交互式界面
generate: 自我游戏生成器
gym_server: openai 健身房的解耦游戏执行器
perf: 基准测试
配置文件
evaluate,generate并且ui都使用位于config/路径中的配置文件。它由--config选项选择。
训练
要执行训练,您需要同时启动 python 和 rust 二进制文件:
2022-06-11 18:06:09
10.36MB
rust
算法