博弈论(5) 自动机、单步偏离原理、重复博弈
发布网友
发布时间:2024-10-22 01:39
我来回答
共1个回答
热心网友
时间:2024-10-27 21:32
在动态博弈的讨论中,我们引入了自动机的概念来描述纯策略,以便更好地理解重复博弈的结构。自动机是一个由状态空间、初始状态、状态转移函数、状态决策函数组成的系统,它通过状态转换函数对每个结赋予一个状态,并通过决策函数诱导一个策略。这使得我们能够将动态博弈中的策略以更为直观和系统化的方式进行表示。
自动机与纯策略组的关系体现在它们之间可以相互诱导,即任意一个自动机可以生成一个博弈的纯策略组,反之亦然。这为后续使用自动机描述纯策略提供了可能。通过自动机,我们能够对博弈的各个结进行分类,并通过决策函数来定义策略,从而在两层面上描述了动态博弈。
自动机的纳什均衡和子博弈精炼纳什均衡的概念引入了对策略稳定性的考量,通过自动机的定义,我们能够判断一个策略组是否满足纳什均衡,以及是否在子博弈层面保持稳定。这为分析策略的稳定性提供了工具。
接下来,我们进入了重复博弈的讨论,它是一种特殊的动态博弈,其中每个阶段博弈在时间上重复进行。通过构建重复博弈的框架,我们定义了它的特征和收益。对于无限期重复博弈,我们采用了收益的递归表述,通过递归等式来定义收益序列。对于有限期重复博弈,我们则关注单步偏离原理,即在某个子博弈中是否存在有利可图的单步偏离。
单步偏离原理是检验SPNE(子博弈精炼纳什均衡)的一个重要工具,它指出如果不存在有利可图的单步偏离,则该策略组是SPNE。这一原理在有限重复博弈中尤为重要,通过分析子博弈策略的收益,我们能够判断策略组是否为SPNE。
在应用部分,我们通过囚徒困境的例子探讨了有限重复博弈中SPNE的存在性,并介绍了Grim Trigger策略和Stick & Carrot策略。Grim Trigger策略通过设定一个永远惩罚的NE来强制合作,而Stick & Carrot策略则通过在惩罚后恢复合作来实现长期的合作激励。
总的来说,通过自动机和单步偏离原理的引入,我们对动态博弈和重复博弈有了更深入的理解。这些理论不仅提供了分析策略稳定性的工具,也为理解实际生活中的重复互动提供了模型。