12A猫で学んだこと-Memoir-

...What are you learning now?

-占狼村村-における狼と判断役の戦術と均衡解-

さて、前回までのエントリーで人狼における良い進行とは 主観確率と、相手陣営の戦略予想に基づいて勝ちの可能性が一番高くなるようにするのが 良い進行なのである。ということを主張しました.

このエントリーでは、人狼というゲームを極めし者のゲームがどのようになるかを 考えたいと思います。 例えば、極めた者達のゲームでは完全情報ゲームのチェス、将棋、囲碁では、 先手番か後手番が定まっただけで勝利が決まります。 人狼は不完全ゲームなので、ポーカー/麻雀というようなゲームと似た性質があり、 極めた者達であったとしても、絶対に勝利というような手筋は存在しません。 ゲームとしては、ジャンケンの方に近いでしょうね。

そして、全ての参加者が極めた者達の人狼であったとしたら、 "発言"や立ち振る舞いがゲームに与える要素は0としてみなすべきでしょう.

また、本来人狼は連続時間でCOが許されるゲームなのですが、 問題を簡単にするため離散時間のゲームとして置き換えて考えると、 参加者達が取れる手、(莫大な数になりますが)有限になります。 ゲームの各場面の状況下でその手をとる確率分布関数を定義することが 戦略を定義するということになります.

発言などによる主観確率の更新がない前提下では、 自分以外のプレイヤーの戦略が完全に知ることができれば、 主観確率の更新は計算によってできるし、 それによって最善策をとることが可能です。(じゃんけんで相手が何を出すかが分かっていれば、 絶対に勝てるのに似ていますね。)

しかし、一般には相手の戦略が読むことができないので, 最善策を常にとることは不可能です. ですが、相手の戦略に関わらず、勝率を一定にさせる戦略をとることは可能です。 (じゃんけんで、相手がどんな手を出しても、自分がグー/チョキ/パーを1/3ずつで出すように すれば, 勝率を1/3にできることと同じです.)

 

例を考えましょう. 本当は、11Aとか12A猫とか数多くプレイされているゲームで考えたいのですが, 状況の数と戦略が膨大になり、とても記述できるものではありません. そこで, 次の単純なゲームで考えましょう.

 

<均衡解を考えるケース.> 初日の夜が 占狼村村の4人のゲームです. (役欠けルールあり) 狼として取れる戦略は, 占いCOをするかしないかです. 2日目朝の状況としては, 以下の通りです.

占い0CO:(占い初日確定)

占い1CO:(占い初日かつ狼の占い騙り or 村人初日かつ狼が占い騙りをしない選択)

占い2CO:(2人の占い候補が互いを狼主張, どちらも破綻していない)

占い2CO:(1人の占い師候補が確定破綻 = 狼)

 

占い0COの時は3グレー1吊りの村勝率を1/3とします.

占い2CO:(2人の占い候補が互いを狼主張, どちらも破綻していない) 時の村勝率を1/2とします.

占い2CO:(1人の占い師候補が確定破綻 = 狼) の時の村勝率は1です.

占い1COの時、●もらいを吊るという戦略を判断役がする確率をb, 占い候補者を吊る選択肢をとる確率を1-bとします.

狼が占い騙りを選択する確率をa, しない確率を 1 - a とします.

 

<その他の(あまり重要ではない)仮定と説明>

* 占いCOは朝一のみである. 狼は(破綻しないように)後出しCOをすることは不可能とする.

* 占い候補が初日に死ぬ確率1/3, 村人は2/3. * 初日占い候補でない時、狼が占いCOをして破綻する可能性は1/2, 破綻しない可能性は1/2.

* 占い師候補は初日犠牲者を占うことはない。従って、占い師候補の○出しは、他の生存者に対する●出しと同義とみなす.

 

aやbというパラメータが確率分布関数を定義する、つまり戦略の決定になります. aやbを用いた時の村の勝率の計算は以下の通り.

 

[初日の犠牲者が占い師の時] with probability 1/3

a * (1-b) + 1/3 * (1 - a) = -ab + 2/3 a + 1/3 ・・・式[0]

<狼が占い騙りをするが、占い候補者が釣れる + 占いCO者がいないとき、1グレー3吊りに成功する>

[初日の犠牲者が村人の時] with probability 2/3

a * (1/2 + 1/2 * 1/2) + (1 - a) * b= -ab + 3/4 a + b ・・・式[1]

<占い2COの時、狼が破綻するか占い候補の2択で狼が釣れる + 占い候補者の●が釣れる>

 

従って, 全体として, 村の勝率は 1/3 * 式[0] + 2/3 * 式[1]となり,

計算すると -ab + (13/18)*a + 2/3*b + 1/9 ・・・式[2]

となります.

 

狼の立場からはこの式[2]の値を(aをコントロールして)小さくするのが目的ですし, 判断役の立場からは式[2]の値を(bをコントロールして)大きくすることが目的になります.

さて, 狼の立場を考えてみましょう. 狼がコントロールできる(決定できる)のはaのパラメータですね. bは判断役が決めるものなので, 狼はコントロールできません. (偏)微分, 式[2]の線形性(aに関して1次式であること)等 数学のツールを何でもいいから使って解析すると, 式[2]を最小にするaの値は以下のようになります.

b > 13/18の時, a = 1で式[2]は最小値 15/18 - 1/3 * b

b < 13/18の時, a = 0で式[2]は最小値 2/3 * b + 1 / 9

b = 13/18の時, aの値に関わらず式[2]の値は 16/27

人狼の言葉で置き換えると, 判断役が占い師の●を吊ってくれる(bの値が大きい時)は, 狼は積極的に占いに騙れ, 逆に占い師の●を吊る確率が低い時には(bの値が小さい時)は, 狼は占い騙りは止めろということになります. ちょうどb = 13/18であったら、どっちでもいいということになります.』

逆に判断役の立場を考えてみましょう. 判断役がコントロールできるのはbのパラメータです. そして式[2]を最大にすることが判断役の目的になります. aは狼が決めるものなので, 判断役はコントロールできません. 数学の道具を使って解析すると

a > 2/3の時, b = 0で式[2]は最大値 13/18 * a+ 1/9

a < 2/3の時, b = 1で式[2]は最大値 7/9 - 5/18 * a

a = 2/3の時, bの値に関わらず式[2]の値は 16/27

人狼の言葉で置き換えると, 狼が占い師を積極的に騙る(aの値が大きい時)は, 判断役は占いCO者を釣れ, 逆に狼が占いを騙らない時は, 判断役は占い師の●先を釣れということになります. ちょうどa = 2/3であったら、どっちでもいいということになります.』

 

狼の立場からすれば, 占いを騙る率を2/3にすれば、 判断役がどのような戦略をとってきたとしても勝率16/27です. これは、もし判断役にaの値が完全にばれていたとしても, 判断役が 16/27よりも村の勝率を上げることができないという点で最善の戦略です. 判断役の立場からすれば, 占い候補者の●もらいを吊る率を13/18にすれば, 狼がどのような戦略をとってきたとしても勝率16/27です. 狼が判断役の吊り方についての情報を理解している(bの値が知られている)としても 狼はこれよりも小さい村勝率にすることができません. 村勝率16/27がこのゲームの均衡点になっています.

 

今回の例は単純でしたが、複雑なルールになったとしても 同様の議論が可能だと予想しています. プレイヤーの数が参加者全員で, 投票の結果などによって 場合分けが非常に多いので, 原理的には可能だとしても 実際記述を行うのは無理ですけどね.

このように極めた人狼というのは結局の所, ジャンケンと同じようなゲームに終着するというのが, 数学的な考察から導きだされるメッセージです. 人狼を極めし神々が永久的に人狼を繰り返す場合, (今回の例だったら) 村勝率16/27ということに収束するでしょう.

 

実際の村の参加者は論理的な考察が(人狼という非常に難解なゲームで論理的推論を行う為の) 力が十分にない人間達の戦いです. 数学的な考察がimplyしてくれることの捉え方は人それぞれですが, 自分個人としては, 人狼における完璧プレーは無理なのだから, 人狼を楽しむことに主眼をおいたほうがいいと思いますね. そして, 勝率が高い人をすごいとは思いませんね. その方は確かに「場を読む = 他の人間の戦略を見抜く」力が高いのかも しれませんが, それはただ単に(私も含めた)周りのプレイヤーが弱いからこそできていることです. そんな人をadmireするよりも, 1つ1つの村で論理性の高い考察をしてくれたり, 予想外の平和を出してくれたり, 完全な詰み進行を短い時間で提示してくれたり. レベルが高いなーと思わせてくれるプレーをたくさんしてくれる 人をadmireしたいと思いますね. 最後の議論はちょっと強引? そうかもしれませんね. ただ、人狼は参加者と観戦を楽しませるエンターテイメント. それ以上でもそれ以下でもないというのが私の主義なので.

 

Appendix

<主観確率との関係>

自分視点の相手の予想戦略が定まれば, 主観確率は計算できるということを述べました. 今回の4人の例で, 判断役視点で

占いCOが1で●先が狼である確率と 占い候補が狼である確率を計算してみましょう.

狼が占いを騙る主観確率をaとすると

[占い1COである状況になる確率] 1/3 * a + 2/3 * (1 - a)

なので, 計算をすると

[占い候補者が狼である確率]

a/(2-a)

[占いの●先が狼である確率]

(2-2a)/(2-a) となります.

この確率のうち, 大きい方を選ぶことが判断役視点, 論理的に良い進行になるでしょう.

 

ちなみに,

これに a = 2/3を代入すると, どちらの値も1/2になります.

a = 2/3が一種のturning pointになっていることはこの結果からも分かります.

均衡解を求める時の議論も, (aを2/3の値と比較して)吊り先を決定すべきという結果だからです. 主観確率計算と均衡解には何らかの関係がありそうです.均衡の意味合い的には, 主観確率1/2になる点が均衡解の時だと明快ですね. 一般的に成り立つのか検証が不十分ですし, 証明することができていないのですが.