12A猫で学んだこと-Memoir-

...What are you learning now?

猫狩村狼狼, 5人2Wの時の村勝率と最適戦略について

12A猫のデータサイエンティスト 人狼◆6S-mLzffKeさんがこのブログを見てくださったようです. 嬉しいなーと思ったのもあって, 久しぶりに算数をやってみました.

 

-占狼村村-における狼と判断役の戦術と均衡解- - 12A猫で学んだこと-Memoir-

 

のエントリで 人狼ゲームは, 全てのプレイヤーが最善を尽くすという仮定を入れると,
均衡解に収束すると主張して, その1例を主張しました. 

他の例としては, 

雑多な話とゲームの均衡解の例 - 12A猫で学んだこと-Memoir-

で計算したように, 5人狼猫狼村村 猫騙り1の状況で村勝率の均衡解は5/24でした.
そして, 狩人が入ると問題がややこしくなると言及しました. ・・・やってみました.
狩人生存確定の時のこのゲームの均衡解の導出.

 

客観的な戦略の是非の証明の難しさが面倒なことを感じていただけますと幸いです.

今回のケースよりも, より複雑なケースでも, 同様の議論を展開することによってゲームの戦略について考察することは可能です. しかし, 必要なパラメータが爆発的に増加していきます. 原理的に可能ですが・・・ 人間の手で計算すると, 悲しみが生まれます.

 

・・・細かい計算で, 間違っていたらごめんね. ただ, 計算の方針としては誤っていないと思います. 

 

<内容のまとめ>
『5人2W 猫2CO村人1潜伏狼1W潜伏狩人1の時、村陣営は猫又決め打ちを行う。』
村(猫), 狼, 狩の均衡戦略が存在し, その時の村勝率は5/16である.
狩人がCOすることによって, 村(狩人)2択決め打ち -> 猫2択決め打ちすることによって,
村勝率3/8を達成でいるので, 狩人がCOした方が村の勝率は高くできる. 

 

考えるのは次の問題です。
『5人2W 猫2CO村人2潜伏狩人1の時、村陣営は猫又決め打ちを行う。 この時、ゲームの村勝率の均衡解の値はいくつか?』
結論, 均衡解の時の村勝率は5/16. その時の狼の戦略と, 村 - 狩人陣営の戦略の概略は以下の通り,
狼は真猫に投票を2/3の確率で行う.
狩人は狼猫投票者が1の場合, そちらを護衛する.
最終日, 猫(確定村)は, 狩人2COに真猫投票者が1いた場合,
そちらに投票する.
最終日, 猫(確定村)は平和がでなかった場合, 真猫投票者に11/16で投票する.

 

(以下詳細な議論です. 計算ミス等あったらごめんね.)

 

*猫又候補 5人のとき、猫又候補同士は相互投票を行う.
最終日猫又(確定村人)は次のような戦略をとるとする.
○3人最終日の場合
1. 真猫に投票した方が狼である.という戦略をとる. with probability a
2. 猫への投票は無視して、ランダムに投票対象を選択. with probability 1-a

○初日に偽猫が釣れて、狩人の平和がでた場合。
1. 真猫に投票した方が狼である.という戦略をとる. with probability b
2. 猫への投票は無視して、ランダムに投票対象を選択. with probability 1-b

○初日に真猫が釣れて、偽猫が道連れになったが、狩人の平和がでて2択になった場合. 1. 真猫に投票した方が狼である.という戦略をとる. with probability c
2. 猫への投票は無視して、ランダムに投票対象を選択. with probability 1-c
投票による条件がフラットな時には、ランダムに投票対象を選択する.

 

*狩人は以下の戦略をとる.
○偽猫が釣れた場合。
1. 狼猫に投票したPLを護衛する. with probability d
2. 猫への投票は無視して、ランダムに護衛対象を選択. with probability 1 - d

○真猫が釣れて偽猫が道連れになった場合。
1. 狼猫に投票したPLを護衛する. with probability e
2. 猫への投票は無視して、ランダムに護衛対象を選択. with probability 1 - e

 

その他の投票による情報がフラットな場合は、ランダムに護衛をする.
視点村人が確定している時には, その村人を護衛する. 

 

*潜伏狼は以下の戦略をとる.

○5人の時,
1. 真猫に投票する. with probability A
2. 真猫に投票せず、ランダムに投票対象を選択する. with probability 1 - A

○狼が身内票をした時に、偽猫が釣れて4人の時かつ、投票で1人の村陣営が真猫に投票している時。
1. 偽猫に投票したPLを噛む. with probability B
2. 猫の投票を無視して、ランダムに投票対象を選択する. with probability 1 - B

○狼が身内票をしなかった時に、真猫が釣れて偽猫が道連れになった3人の夜の時、
1人の村陣営が偽猫に投票している場合。
1. 狼猫に投票したPLを噛む. with probability E
2. 猫への投票は無視して、ランダムに噛み対象をを選択. with probability 1 - E

狩人視点村人が確定している時には, ランダムに噛み対象を選択する. 

 

場合分けをひたすら考えていきます. 

 

1. 狼が真猫に投票する場合. w.p. 1/2(A+1)

1-1-1[投票.猫<-狼村狩]の時で、対抗狼が道連れになった場合. (1/4)
平和を出し, (狼による)狩人CO2択に勝つことが勝利条件 1/4

1-1-2 [投票.猫<-狼村狩]の時で、潜伏狼が道連れになった場合. (1/4)
狩人が平和を出すことが勝利条件 1/2

 

1-2-1 [投票.猫<-狼狩]の時で、対抗狼が道連れになった場合.(1/4)
狩人生存確率: 1/2(E+1)
狩人護衛成功確率:1/2(e+1)
最終日狩人2択の勝率1/2
1/8(E+1)(e+1)

1-2-2 [投票.猫<-狼狩]の時で、潜伏狼が道連れになった場合. (1/4)
1/2

1-3-1 [投票。猫<-狼村]の時で、対抗狼が道連れになった場合. (1/4)
狩人生存確率: 1/2(1-E)
狩人護衛成功確率:1/2
最終日狩人の2択: 1/2(c+1) 1/8(1-E)(c+1)

 

1-3-2 [投票。猫<-狼村]の時で、潜伏狼が道連れになった場合.(1/4)
1/2

 

1-4 [投票. 猫<-狼]の時.
狩人生存確率: 1/2
狩人護衛成功確率: 1/2(1+d)
最終日狩人CO2択: 1/2(b+1)

 

平和が出せなかった場合, 1/2(a+1)
従って,
1/4(d+1)1/2(b+1) + (1 - 1/4(d+1))1/2(a+1)

 

2. 狼が偽猫に投票(身内票)する場合. w.p. 1/2(1-A)

2-1-1 [投票.猫<-投票無し]の時
1/2

 

2-2 [投票.猫<-狩]の時
2-2-1 狩人が生存する時 狩人生存確率:1/2(1+B)
狩人の護衛成功確率1/2
最終日狩人2択: 1/2(1-b)
狩人の護衛失敗確率1/2
最終日2択: 1/2(1-a)
2-2-2 狩人が噛まれる時
最終日2択:1/2(1-a)
したがって, 2-2の時,
1/4(1+B)1/2(1-b) + (1 - 1/4(1+B))1/2(1-a)

 

2-3 [投票.猫<-村]の時
狩人生存確率:1/2(1-B)
狩人護衛成功確率:1/2(1-d)
最終日狩人2択 1/2
狩人護衛失敗確率: 1- (1/2(1-d))
最終日村人2択 1/2
狩人死亡確率(1-1/2(1-B))
最終日村人2択 1/2(1-a)
1/2(1-B)*1/2(1-d)*1/2 + 1/2(1-B)*(1- 1/2(1-d))*1/2 +(1 - 1/2(1-B))*1/2(1-a)
=1/2(1-B)*1/2 + (1-1/2(1-B)*1/2(1-a))

 

2-4-1 [投票. 猫<-狩村の時]で偽猫道連れの場合 (1/4)
狩人生存確率: 1/2
狩人護衛成功確率: 1/2(1-e)
最終日狩人2択: 1/2(1-c)
1/8(1-e)(1-c)

 

2-4-2 [投票. 猫<-狩村の時]で潜伏狼道連れの場合 (1/4)
1/2

 

以上の議論をまとめることにより,
村勝率は
1/2(A+1)*1/4*{1/16 + 1/8 + 1/32(E+1)(e+1) +1/8 +1/32(1-E)(1+c) + 1/8 + 1/4(d+1)1/2(b+1) + (1 - 1/4(d+1))1/2(a+1)}
+1/2(1-A)*1/4 * { 1/2 + 1/4(1+B)1/2(1-b) + (1 - 1/4(1+B))1/2(1-a) + 1/2(1-B)*1/2 + (1-1/2(1-B)*1/2(1-a)) + 1/32(1-e)(1-c) + 1/8} となる.

後は, これをそれぞれのパラメータについて偏微分を行うことによって, 情報を引き出すことができる.

 

簡単な所から値を確定させていく.
Bで偏微分をした結果は負なので, B=1が狼の戦略となる. 従って, B=1を代入して考える. dで偏微分をした結果は, (正の数)*(b - a)なので, 均衡解の時には, b = aとなる.
Eで偏微分した結果は, (正の数)*(e-c)なので, 均衡解の時には, e = cとなる.

 

その結果を代入すると,
1/8(1+A)*(7/16 + 1/16(1+c) +1/2(a+1)) +1/8(1-A)*(5/8 + (1-a) + 1/32(1-c)^2)

 

 

cについて微分した時の結果は, 1/8*1/16( 2 - c(1-A))なので, 正の数.
従って, 猫の戦略としては c = 1になる. 従って, c = 1を代入する.
aについて微分した結果は3/16(A-1)なので, 均衡解の時, A = 1/3

 

c = 1を代入して, Aについて微分した時の結果は, 3/16(a-3/8)である.
従って, 均衡解の時は, a = 3/8, そして, 以上の値より得られる,
均衡解の村勝率は5/16である.

 

狩人生存が確定していれば, 狩人がCOすることによって, 村勝率は3/8とする手順がある. したがって, 狩人生存が確定しているという状況下では, 狩人はCOしたほうがいいと
結論づけられる.

 

従って, 5人狼猫狩村狼から始まるゲームの村勝率は3/8である.