基于蒙特卡罗树搜索的 Quoridor AI 是一个抽象的策略游戏,在 81 (9x9) 个正方形的棋盘上玩,目标是让你的棋子到棋盘的另一边。 这个玩 Quoridor 的 AI 代理基于 。 纯 MCTS 导致性能不佳。 应用一些启发式方法后,性能得到了显着提高。 我在树搜索的选择、扩展和模拟阶段(以及搜索后的后期处理)添加了启发式方法。 您可以在下面的“包含的一些启发式方法”部分中看到其中的一些。 如果您想查看所有启发式方法或其实现细节,请参阅源代码中的注释。 (找到“启发式”这个词。) 您可以在网站(或 Web 应用程序) 上与此 AI 对战。 网站上每个 AI 级别的每次移动推出次数如下。 等级 每次移动的卷展栏 新手 2,500 平均 7,500 好的 20,000 强的 60,000 最新版本 (v0.3) 中包含的一些启发式方法 Quoridor 的分支因子很
2025-05-20 08:48:09 95KB ai mcts quoridor monte-carlo-tree-search
1
机组组合问题属于规划问题,即要在决策变量的可行解空间里找到一组最优解,使得目标函数尽可能取得极值。对于混合整数规划,常用的方法有分支定界法,benders分解等。CPLEX提供了快速的MIP求解方法,对于数学模型已知的问题,只需要按照程序规范在MATLAB中编写程序化模型,调用CPLEX求解器,即可进行求解。 建立含安全约束的机组最优组合(SCUC)模型如下:目标为最小化成本,包括发电带来的煤耗成本和机组启停产生的开停机成本。 约束条件包含:功率平衡约束、热备用约束、机组出力约束、机组爬坡约束、机组起停时间约束、起停费用约束、潮流安全约束。 模型简化:由上小节构建的机组组合优化模型,煤耗成本采用二次函数,当系统规模较大时(如节点数超过1000),求解起来将消耗大量时间。因此我们可以对原模型进行线性化处理。将煤耗函数分段线性化,分为m段。 校验程序的算例基于IEEE-30节点标准测试系统。系统包含30个节点,6台发电机组。要求确定系统最优机组组合,使得系统各机组总运行成本(煤耗成本+启停成本)最小化。
2024-01-19 22:34:45 211KB matlab CPLEX 机组组合 优化规划
1
适用于电力系统机组组合优化问题,包含MATLAB源程序代码
2024-01-12 16:42:32 2KB matlab
以IEEE-30节点系统(6个发电机)为例,在满足各项约束的条件下,以经济性最优最小化成本为目标函数,求解系统内机组的组合结果,包括机组启停计划、各时段最优出力,以及内含的各时段的直流潮流
2023-11-22 11:12:26 313KB matlab 成本优化 IEEE30 毕业设计
1
蝙蝠算法是受自然界中的蝙蝠通过回声定位进行搜寻、捕食猎物行为的启发, 并将多智能体系统与进化机制相结合发展而来的优化方法。作为一种新颖的仿生群体智能优化算法, 分析了蝙蝠算法的仿生原理、优化机理及特点, 对算法优化过程进行了定义。通过标准算例对蝙蝠算法在连续空间和离散空间的优化性能进行了仿真测试, 结果表明该算法在函数优化和组合优化方面应用的可行性和有效性, 具有良好的应用前景。
1
matlab广度优先算法代码反向剪麦奇 组合优化:反向Cuthill Mckee排序算法(RCM) RCM算法 这是用于反向Cuthill Mckee排序算法(RCM)的Matlab代码。 RCM是一种将具有对称稀疏模式的稀疏矩阵置换为带宽小的带矩阵形式的算法。 实际上,与应用高斯消除法的CM命令相比,这通常导致较少的填充。 它从外围节点开始,然后生成级别,直到所有节点耗尽为止。 这些节点以递增的顺序列出。 最后一个细节是广度优先搜索算法的唯一区别。 语境 Cuthill-McKee算法是常用的最重要的重排序技术之一。 该算法是“广度优先搜索”算法的变体。 后者是EFMoore在1950年代中的n年创建的一种参考算法,用于使用the来迭代扫描图形。 Cuthill-Mckee算法基于Elizabeth Cuthill和J. McKee在1969年的贡献。其主要目的是通过对相关图的顶点进行重新编号来减少空心对称矩阵的带宽(即,两个相邻顶点之间的距离)。 。 输入和输出 perm : the output permutation vector A : the initial matrix
2023-05-23 16:32:46 19KB 系统开源
1
mcts井字游戏 使用mcts解决井字(3x3)问题。 这样做是为了研究mcts的概念。 youtube演示: : 要求 pygame 怎么玩 python play.py 实施细节 selection :UCT算法( ) expansion :从状态创建所有可能的节点 simulation :随机播放模拟(=随机推出策略)。 这种仿真方法会降低性能。 backprop :向后传播仿真结果。 参考 致谢 为实现算法提供了很多帮助。
2023-04-15 10:37:23 30KB tic-tac-toe mcts Python
1
霍金斯-国际象棋AI “霍金斯”是由Minimax搜索算法提供支持的Chess AI。 它利用了各种优化技术,主要是对alpha-beta修剪和其他传统国际象棋引擎方法的扩展。
2023-03-29 10:01:07 325KB Python
1
A course in combinatorial optimization (A. Schrijver) 经典的组合优化教材
2023-03-11 10:19:33 1.3MB optimization 组合优化
1
交叉熵方法是一个自适应的收敛优化方法,对解决优化问题效果非常的好
2023-03-05 16:59:52 573B 交叉熵 优化
1