0%

双十一集赞游戏、博弈论及其他

双十一

比起往年的双十一,商家参与的热情稍微消退了一些。但是淘宝2018年的双十一游戏却十分有趣,比起传统的运气类游戏,这种包含合作和对抗的PvP游戏有非常多可说之处。

游戏规则

游戏持续约20天,每一天为独立的一局比赛,每局比赛根据当前的积分(能量值)进入不同等级的场次随机匹配对手进行PK。PK的规则为获取更多赞的队伍获胜。

每一局比赛开局收取一定量的积分(能量值)作为入场费,获胜的奖励积分(能量值)约3倍于开局收取积分。若PK双方赞数不等,赞高者获取全部奖励,赞低者无奖励;若赞数相等,双方平分奖励。

此外,每个用户每天为他人点赞上限为6次,每只队伍只能点赞一次。(忽略超级会员)

游戏提供了非常有限的交流功能,双方可以通过修改队名向对方传达简单的文字消息。

游戏者间关系

集赞游戏的游戏者分为队友和对方选手。队友之间的关系主要为合作;PK双方的关系主要为竞争,不同队伍的玩家之间为合作关系(未进行PK)。

囚徒困境

对局双方

每一局游戏存在一个近似的囚徒困境。

从收益来说,每一局游戏游戏者的总收益是固定的,可以等效为一个零和博弈。但是成本是可变的,最低的成本为双方均不参与集赞,此时成本为0,而双方都能获得大于0的收益(奖励减去入场费)。但是由于游戏双方能够进行交流的途径只有简单的队名,无法建立实质性的协议(无法惩罚“不合作”行为),所以这个理论上的纳什平衡是不可达到的。

由于无法建立有效的合作,PK双方的关系就由合作转为竞争关系。对于一方的游戏者来说,最终成本最低的获胜方式为仅高于对方一赞,但是显然这样的平衡是不稳定的,理想的决策取决于游戏者对于短时间难以追上的认知,一旦达到这一条件,游戏就会暂时趋于稳定,直到另一方缩小这一差距或超过。从双方的游戏的过程来看,这是一个不完全信息的动态博弈。

简单分析

假设双方队伍游戏者人数相等,不同游戏者集赞能力,对于集赞的成本认知相当,时间成本相当。由于每一局游戏存在确定的结束时间(23点),游戏者只需要取得最后一次博弈的胜利即可获得奖励,理论上合理的决策为预估集赞达到对方短时间难以追上需要的时间,在最后的这一段时间内完成集赞。这一决策需要考虑对方发觉当前游戏者集赞行为所需的时间 _t_。亦即,在对方发觉并完成集赞行为前就得达到目标赞数,然后双方以同等速率进行集赞直到结束时间。需要注意的是,由于集赞速率有限,游戏者需要保持当前赞数的差距能够在开始集赞到对方发觉的时间内追上并建立优势。

由于集赞行为开始到产生效果存在不短的时间,对对方发觉集赞行为所需的时间需要将其计算在内。

而对于另一方来说,一旦发觉对方的赞数无法在结束时间前超越,进行集赞行为的边际收益就降到了0,因此,此时合理的决策为放弃当前局比赛。可以看出,在这种决策下的集赞游戏存在一定的先动优势

但对于过早建立先动优势的游戏者来说,一旦其优势地位建立而对方短时间内未打破当前的稳定状态,其发觉对方集赞行为所需的时间就会由于对于游戏的关注度减少而变长,另一方需要保持的最大差距就会变大,己方其实处于一定的风险之中。

实际情况

实际情况下,对局双方往往存在一定的集赞水平差异。由于不完全信息,双方为取得游戏的胜利需要对对方实力进行合理的试探以判断其集赞能力,另外在进行决策时需要对对方实力进行包含一定放大的估计。另一方面由于集赞速率随当前集赞数非线性变化的特点,对集赞能力进行预估存在一定的困难。且游戏双方往往存在不同的集赞能力上限,所以游戏的结果存在不确定性。但根据以上简单地分析来说,比较合理的决策,是在游戏开始后将差距维持在一定范围内,在游戏距结束较近时建立优势。

同队游戏者

同队游戏者的关系其实也可以视为一个囚徒困境的模型,但是由于接近完全信息、试图“合作”和“不合作”惩罚的存在,往往能够达到纳什平衡状态,游戏者之间为合作关系。

其他队伍游戏者

不同队伍的游戏者可以通过互赞的方式增加彼此的赞数,与同队游戏者相似,这一过程也接近完全信息,存在试图“合作”和“不合作”惩罚双方为正和博弈,往往为合作关系。

万元陷阱

实际上,由于这个游戏中还有另一个典型模型:万元陷阱,最理想的决策并不一定是以上分析的结果。

万元陷阱:拍卖一万元,起拍价100,每次递增为100,出价最高者可以拍得1000元,同时第二高的出价者需要支付其所出价金额。

每一局游戏中,游戏双方通过不断增加赞数来获取游戏的胜利,每一个赞的获取都需要一定的成本,而最终获胜所需的赞越多成本就越高。但是增加成本并不会使得收益增加。相反,如果未取得最终的胜利,所有付出的成本都将白白付出。因此,为减少损失,努力获取游戏胜利又成为了一个看似合理的选择。

这一游戏过程中,存在以下特征:

  1. 有明显的诱饵(积分奖励)
  2. 成本的付出是单向的,即便放弃比赛也不能减少成本
  3. 越想要获取胜利,可能需要付出的成本越大

在游戏中,如果和对手在赞数上出现胶着,往往会出现甲超越乙,乙又很快超越甲的状态。随着游戏的继续,双方的沉没成本不断增加,双方都无法下定决心放弃游戏。而由于双方获取的赞数存在一个实际上的上限,最终会在一方无法获得足够的赞以超越对方时结束游戏。

可以看出,这种结果对于双方来说都是成本最大的,应当尽量避免。对于两个足够聪明的对局方来说,如果一方一开始就表明势在必得破釜沉舟的决心,游戏就会在此时结束。从这个角度来看,一个比较合理的决策是一开始就集到足够多的赞以“劝退”对方,让对方即时止损。(这个角度也是先动优势,但是明显存在一些差异)

在实际中,由于游戏者的水平不一,且对于止损的预期不同,一开始就集许多赞也并不能保证对方一定放弃。

另外,由于存在确定的结束时间,”劝退流”玩儿法可能的成本要高于仅追求最后一期游戏胜利的决策。

经建议,分享到支付宝不用复制粘贴就可以点赞。