平均场博弈均衡计算
平均场博弈论是研究非常大的群体中的小相互作用主体的战略决策的研究。 在连续时间内,平均场博弈通常由描述个人最佳控制问题的汉密尔顿-雅各比-贝尔曼方程组成。 在相当普遍的假设下,可以证明一类平均场博弈是N玩家Nash均衡的N→∞的极限。
介绍
我们分析了一种特定类型的均场博弈。 玩家因完成任务而获得奖励(无论任务的类型无关紧要)。 每个玩家的奖励均基于所有玩家之间的排名(即完成时间的分位数),而排名奖励功能是由决策者设计的。 而且,每个玩家都有固定的预算,他们可以花费这些预算来提高效率,即缩短完成时间。
定点数值算法
该项目采用定点算法实现纳什均衡(即完成时间F T的累积分布函数)求解器。 奖励功能是输入,可由用户更改。 该算法通过求解一组偏微分方程(PDE)递归更新期望值函数,唯一的逐点最大化器,完成时间流入/流出速率和F T。 如果新的F T与当前F T足够接近,则定
2021-09-26 13:28:44
2.57MB
Python
1