管理学百科|12Reads

最小最大定理

什么是最小最大定理?

在零和博弈(A从B获利)中,A采取将自己最小利益最大化的策略,而B采取将A的最大利益最小化的策略是最稳妥的行为。这时双方的策略中一方的最大值与另一方的最小值保持一致,这就是所谓的最小最大定理。

最大最小策略(Maxmin Strategy)与最小最大策略(MinmaxStrategy)

在6的点球例子中,如果守门员采取让射手的射门成功率最低的策略,即向左概率75%,向右概率25%,那无论射手采取怎样的策略。都能将他的射门成功率控制在52.5%以下。这也是最稳妥的做法。因为虽说对方采取莽撞策略时,守门员并无法伺机增加利益,但如果站在“对方总会针对自己的行为做出最恰当的反应”的前提下,那就能将对方的利益控制在最小限度。在零和博弈中,最常见的做法就是将对方的最大利益(在最有利的情况下能得到的利益)最小化。

图1

图1

再举个更简单易懂的例子。假设B要给A钱,但金额由图1所示的变相猜拳决定。局中人A、B的选项有石头、剪刀、布三种。如果A出石头,B出剪刀时A能拿到的钱最少(因此最小值为3)。同理,A出剪刀时的最小值为1,出布时的最小值为0。

如果A出剪刀,能拿到的金额可能是10,也有可能是1。如果A出最小值最高的石头,那至少能拿到3。因此对A而言最稳妥的做法就是选择石头,即能让自己的最小利益最大化的“最大最小策略”,见图2。

从B的角度看,出石头、剪刀、布需要支付的金额的最大值分别为10、3、6,这时B就应该选择剪刀,使支付的最大金额为3。因此B所选择的策略就是能让对方的最大利益最小化的“最小最大策略”,见图3。

最小最大定理的博弈

在零和两人博弈中,一方的最大最小策略得出的最小利益的最大值与另一方的最小最大策略得出的最大利益的最小值一致。这就是所谓的“最小最大定理”。在猜拳的例子中。两个值都是3。

图2:A的最大最小策略

图2:A的最大最小策略

最大最小策略与最小最大策略不一定是纯策略。以罚点球为例,从守门员角度看,“将射门成功率的最大值控制在最小”的最小最大策略为左75%右25%,而从射手的角度看,将射门成功率的最小值最大化的最大最小策略则是左37.5%右62.5%。两者策略的最小值与最大值在52.5%取得一致。由此可见在混合策略中,最小最大定理也是成立的。

最小最大定理的证明过程很复杂,在此不再赘述。但这条定理中存在几个重要的提示。第一,在零和两人博弈中,必定存在最适合各个局中人的纯策略或混合策略,对局必定有解。第二,如果想知道双方使用混合策略时各自的得失,只要计算一方的最佳随机化概率,再推导出此时的对局得失即可。

需要注意的是,最小最大定理在零和两人博弈中成立。但在正和博弈或局中人超过三人的博弈中未必成立。

图3:B的最大最小策略

图3:B的最大最小策略

该词条对我有帮助 (1)
成就高成效,实现管理能力快速提升,12Reads系列教材限时特惠! 立即购买 PURCHASE NOW