Home» News» News» 9月29日李楷报告:From rules to runs: A dynamic epistemic take on imperfect information games

9月29日李楷报告:From rules to runs: A dynamic epistemic take on imperfect information games

发布日期:2015-09-29 作者:
附件:   

一、报告概况

         报告阐述了博弈论中,有关信息不完全的extensive games有两种解释: Game rules, game runs. 而对于此二者的混淆与不区分,导致了一些问题与反直观的例子。因为两种解释并不总保持一致。报告尝试区分这两者,并且给出了一种联系两者的方案:如果假定一些关于游戏者的条件,可以从rules中计算出runs。同时,报告中还给出了一种用来描述游戏者知识在游戏中的变化的模态逻辑,并给出了公理化。最后,报告人阐述了在特定条件下,rulesruns会有同样的效力。

二、问答记录

Q:表示提问           A:表示回答           S:表示补充

 

高珂Qgame rules是否是列举了所有可能的游戏情况?具体说来game rulesgame runs有何区别,可否举例说明?

李楷A: 的确是包括各种情况。区别主要在于runs会把所有实际的操作过程加入,可能会有重复,但rules并不会有类似的成分。

 

高珂Q:这里我们假设的能力很奇怪,到底什么叫做不可区分?

王彦晶A: 这里的关键在于我们发现有两种不同的不可取分。其中一种是和游戏规则直接相关的,游戏规则直接告诉我们的信息上看没有区别,而这种情况下游戏者可能会通过游戏过程获得可以区分的信息。另一种就是更加绝对的不可取分,也就是说即使假设玩家有推理能力和经过了游戏的进程,依然无法区分两种状态。

李楷S: 我们可以举出玩牌的例子,在一开始,大家都是不知道其他人的牌的,所以很多情况都无法区分。但随着打牌的过程,玩家就能获得额外信息来推测出很多情况是不可能的。

 

高珂Q:游戏的复杂性是否会影响我们对于游戏信息的获取?

李楷A:我们这篇文章并没有考虑这方面的问题,我们关注的是玩家的知识的动态进展。

 

赵晓玉Q:可否画图或者用更加直观的方式解释这里定义的game

李楷A(画了一个还算清楚的图)

王彦晶S:这里的O集合就代表游戏规则规定的每个agent能够在特定情况下允许的动作。

 

徐超Q:为何要限制这里的O=O

王彦晶A:我们考虑什么时候玩家不能区分两个点:1.本来就不能区分。2.不能区分这里进行的不同动作。3.没有获得有关的游戏信息。这里的O=O意味着原本是不能区分的。

 

赵晓玉Qgame runs是否因人而异?

李楷A:是的,每次的游戏进程都可能不同。

报告中有两个主要讨论的疑问点:

1Is game information also common knowledge

周北海:如果game information包括一些私人信息比如手牌情况,当然是不common的。但如果只是规则层面的东西,应该是common的。

刘佶鑫:应当是common的才对。这种信息大概指各个玩家能够预想的各种可以行动的方式,这种方式是规则的一部分,自然应该是公共知识。

李楷:我们的假设中不预设玩家具有很强的推理能力,所以有关推理的部分应该不是公共知识,当然应该也不是这里讨论的类型。

 

2、为什么不假定agent可以区分他们自己的action

周北海Q:这里我们考虑的分辨能力为什么会出现不能区分action但具有别的分辨能力?

李楷A:比如蒙眼玩游戏时就会出现这种情况,不知道自己具体做了什么行为。

王彦晶S:这里我们主要是想保留更多的可能性,强调的是不假设,当然也允许有这种假设。

郑植S: 是否可以考虑如下的例子:打牌时,当打两副牌时,手中有两张红桃三,任意打出一张,自己并不知道打出的是哪副牌的那张?

王彦晶A:这里如果是正常的状况集的话,任何一张红心三都是一样的集合,不会带来任何影响。

顾韬S:是不是这种不可区分实质上指我们会遗忘自己的某些行为?忘记了自己曾经做出过的action

李楷A:这种情况应该也可以纳入考虑范围,有些时候会是遗忘带来的问题。

刘佶鑫S:是否可以把大量的关于action的不可区分,还原到关于状态的不可区分上?是否存在不可还原的情况?

李楷A:应当是有一些可以还原,但肯定不是全部,具体例子可能需要更加细致的考虑,能给出更好的答案。

 

高珂Q:动态框架与静态框架相互转化的这种证明思路是否可以推广?

李楷A:可以,因为这种思路原本也来源于王彦晶老师其它的工作,而我们发现这种办法经常会有效果。事实上这些语义学也是有很大类似的。

 

刘佶鑫Q: 能否在进一步的工作中刻画不同人的不同推理能力? 这种不同具体如何体现?

李楷A:关于这点目前的工作还没有涉及到。我推测我们需要新的逻辑工具,用旧的办法语言能表达的能力很受限制。

王彦晶S:大概我们需要改变update的性质和具体方式,而这一点从公里系统里能够看出更多的启示。

李楷S:我们的工作的确需要去处理更多的情况,例如反事实的情况,利用时间算子可能有一定的帮助。

三、刘佶鑫评论

李楷同学的报告思路清晰,主张了一种区分game rulesgame runs的方法,并且给出了联系两者的方式,同时以此出发,强调了游戏过程中游戏者的知识变化,并且给出了相应的技术处理手段。选题有一定的理论意义,并且符合日常的直观。处理方式也对该领域有一定的创新和促进作用。我认为可以进一步努力的方向是:

1、报告的有关技术准备应该更加充分,尽量避免自己的slides出问题影响报告效果。

2、报告中提到了对于不同玩家的推理能力的区分,希望能进一步在技术中体现出这种区分。

3、报告中提问的时候王彦晶老师回答的有些多,虽然文章本身也是李楷和王老师合作的,但希望报告人能对问题回答的更好。

四、周北海导师评论

周老师认为这也是一次不错的报告。主要说了以下3点意见:

1、讨论比较热烈,氛围比较好,应该保持,也希望今后的讨论班能够继续努力,另外评论人也应该更加认真的准备。

2、有关报告内容。首先从准备上略显仓促,也出现了一些不应有的ppt问题,希望报告人能克服较为拖沓的习惯。其次例子应该更加具体,而不是只举出抽象的例子。比如下棋或者打牌之类的游戏都是可以用来说明的实例。另外周老师认为出老千这种情况应属于违反了游戏规则,这一点和报告人有所不同。

3、有关进一步的努力方向。其一,报告人让王彦晶老师帮忙回答了太多问题,应该在这方面有所加强。其二,对于报告的内容,可以考虑把对游戏的分类作为下一个发展的目标,考虑对不同类型游戏的不同处理。


发布时间:2015-09-29 23:06:25