パチンコ2

5年ほど前にした話(↑)の続きです

今回は設定の具体的な推定の方法について書いていきたいと思います

 

1.はじめに

私はパチンコ初心者であるため、パチンコに関する言葉の誤用は見逃して頂きたい また統計に関する言葉の誤用も見逃して頂きたい(免罪符×2)

 

設定判別の手法について、改めて簡単に説明する

ジャグラーを始めとするパチンコ(何号機?などというらしい)には、1~6の設定値が存在し、この値が高いほど大当たりの確率が高くなっている 加えて小当たり(ブドウの絵とか)の確率も設定値に依存しており、総合的に見て、設定値が高いほど出玉率(機械割)が高く、すなわち勝利する確率が高くなっている

よってパチンカーは設定6の台で遊戯を行いたいものであり、それが叶わなくとも設定4や5といった高設定の台に何とかしてありつきたいと考える そしてそのための方法が太古より真剣に研究されてきた

結果、ブドウ率により設定を推定する手法が広く知られるようになった 上記の「設定値によってブドウ率が異なる」という性質を利用し、自分が遊戯した際のブドウ率から設定値を推定しようというのである

例えば、ファンキージャグラー2のブドウ率は以下の通りである

 

設定1 1/5.94

設定2 1/5.93

設定3 1/5.88

設定4 1/5.83

設定5 1/5.75

設定6 1/5.66

 

自分でファンキージャグラー2を1000回ぐらい回してみて、例えばブドウの揃った割合が1/5.68であれば、「何か設定6に近い値だし多分設定6だな」と推定できる、といった理屈である

具体的にはもう少しちゃんとした計算(上記記事の前半部を参照のこと)が行われるが、実はこの推定は設定1~6が均等に分布していることを仮定しており、巷でよく用いられている「設定判別ツール」においてもこの仮定が用いられていることを述べた(上記記事)

現実には低設定の台が圧倒的に多く分布するものであり、このような雑な仮定の下での推定が何ら有意な結果を与えないものであることは、パチンコ初心者の私でも容易に想到できるところ、日々パチンコの研究を重ねているパチンコ上級者にとっては明らかなものであろうと思料する

しかしながら、「自分で計測したブドウ率に基づいて設定値を推定する」という思想自体に決して誤りはない そこで、このような誤った推定方法に代えて、少しでも適切な推定方法を明らかにできればパチンコ界の発展に資することができるものと考えた次第である

 

2.推定方法の導出

さて本題の推定方法についてだが、次の定理が成立する

(定理1)

ある台で n ゲームの遊戯を行い、ブドウ率が \bar{p} であった場合、

確率 \alpha で以下の不等式が成り立つ:

(T_{1})      \bar{p}-\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) \le s \le \bar{p}+\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) 

ただし、

 s = \displaystyle \sum_{k=1}^{6} w_{k} p_{k}

p_{k}:その台が設定 k である確率

w_{k}:設定 k のブドウ率

 z( \beta ) :標準正規分布の上側 \beta

この定理は、設定分布が未知であっても成り立つ定理である

 

以下、定理1の証明を行う

s について母比率推定を行うという内容である 興味のない人は読み飛ばしてもらって差し支えない

 

~証明~

ある台で1ゲーム遊戯した場合に、そのゲームでブドウが揃う確率は

 s := \displaystyle \sum_{k=1}^{6} w_{k} p_{k}  である

従って n ゲーム遊戯した場合のブドウの当たり回数 X について、

 X \backsim  Bin(n,s)

すなわちラプラスの定理により、  n \gg 1 で近似的に、

 X \backsim  N(ns,ns(1-s))

 \Rightarrow \bar{p} := \dfrac{X}{n} \backsim  N \Big( s,\dfrac{s(1-s)}{n} \Big)

 \Rightarrow \dfrac{\bar{p} -s }{\sqrt{\dfrac{s(1-s)}{n}}} \backsim  N ( 0,1 )

よって 100\alpha %信頼区間として、 (T_{1})  式を得る

(なお、信頼限界内の s\bar{p} で近似している)

 

3.定理1の意味

(T_{1})      \bar{p}-\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) \le s \le \bar{p}+\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) 

定理1の意味について説明する

まず s とは何ぞや?というところから...

 

 s = \displaystyle \sum_{k=1}^{6} w_{k} p_{k} =w_{1} p_{1} + w_{2} p_{2} +w_{3} p_{3} +w_{4} p_{4} +w_{5} p_{5} +w_{6} p_{6}

p_{k}:その台が設定 k である確率

w_{k}:設定 k のブドウ率

 

であった

つまり s とは、それぞれの設定である確率 p_{k} に、その設定におけるブドウ率 w_{k} を掛けて足し合わせたものである

ただ  p_{1}  から p_{6} までをそのまま足し合わせるのではない それぞれに w_{k} という重み付けをして足し合わせるのである

 

例えば先ほどのファンキージャグラー2の例で言えば、

 

設定1 1/5.94  \Rightarrow w_{1}=\dfrac{1}{5.94}

設定2 1/5.93  \Rightarrow w_{2}=\dfrac{1}{5.93}

設定3 1/5.88  \Rightarrow w_{3}=\dfrac{1}{5.88}

設定4 1/5.83  \Rightarrow w_{4}=\dfrac{1}{5.83}

設定5 1/5.75  \Rightarrow w_{5}=\dfrac{1}{5.75}

設定6 1/5.66  \Rightarrow w_{6}=\dfrac{1}{5.66}

 

であるから、

 s = \displaystyle \dfrac{1}{5.94} p_{1} + \dfrac{1}{5.93} p_{2} +\dfrac{1}{5.88} p_{3} +\dfrac{1}{5.83} p_{4} +\dfrac{1}{5.75} p_{5} +\dfrac{1}{5.66} p_{6}

となる

本定理は、このような「重み付けがされた確率の和」の範囲を推定する事ができる定理なのである

 

また不等式の左辺及び右辺に現れる  z \Big( \dfrac {1-\alpha}{2} \Big) とは、めっちゃ簡単に言えば \alpha の値に応じて一意に決まる値である

 

すなわち次の流れで、「重み付けがされた確率の和 s 」の範囲を推定することが可能である

(1) n ゲームの遊戯を行い、ブドウの回数を数え、ブドウ率 \bar{p} を計算する

(2) n  、 \bar{p} 、及び好きな確率 \alpha (T_{1}) 式にブチ込む

(3)「確率 \alpha s の範囲はこれですよ」という結果が得られる

 

4.使ってみよう

(例)ファンキージャグラー2を1000回遊んだところ、ブドウが176回出た この結果から、95%の確率で成り立つ s の範囲を推定しよう

 

まずブドウ率 \bar{p} を計算する

 \bar{p}= \dfrac{176}{1000}=\dfrac{1}{5.68}

となり、なんだか設定6に近い値である

 

次に、

(T_{1})      \bar{p}-\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) \le s \le \bar{p}+\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) 

この式に n=1000  、 \bar{p}=\dfrac{1}{5.68} 、そして今回の確率 \alpha=0.95 を代入する 

ここでz \Big( \dfrac {1-\alpha}{2} \Big) の値が問題となるが、今回は z \Big( \dfrac {1-0.95}{2} \Big)=z (0.025)=1.96 となる(詳しくはここを見てください)

代入して計算すると、

95%の確率で s 0.152 \le s \le 0.200 の範囲にある

という結果を得る

 

5.ちょっと改良

さて、このように一応設定に関する推定が完了したのだが、「重み付けがされた確率の和 s 」というよく分からん値の範囲が分かっただけである

 

ここで確率の和は1であるから、それぞれの設定である確率の合計は1であるということを思い出そう

つまり p_{1}+p_{2}+p_{3}+p_{4}+p_{5}+p_{6}=1 ということである

これを用いれば s の中にある p_{1}p_{6} のうちどれか1つは削除できそうである

 

例えば p_{1} を消してみよう

p_{1}=1-(p_{2}+p_{3}+p_{4}+p_{5}+p_{6}) を

s=w_{1}p_{1}+w_{2}p_{2}+w_{3}p_{3}+w_{4}p_{4}+w_{5}p_{5}+w_{6}p_{6} に代入すると、

s=w_{1}+(w_{2}-w_{1})p_{2}+(w_{3}-w_{1})p_{3}+(w_{4}-w_{1})p_{4}+(w_{5}-w_{1})p_{5}+(w_{6}-w_{1})p_{6} となり、 s に含まれる変数を p_{2}p_{6} の5つに減らすことができた

 

しかしこれでもなおよく分からん値であることに変わりはなく、個々の確率 p_{k} の値の範囲は不明である

例えばパチンコ屋さんの旗に「設定1と6の配置割合は秘密ですが、設定2~5についてはそれぞれ10%ずつです!!」などと書いてあれば、

s=w_{1}+0.1(w_{2}-w_{1})+0.1(w_{3}-w_{1})+0.1(w_{4}-w_{1})+0.1(w_{5}-w_{1})+0.1(w_{6}-w_{1})p_{6}

というふうに s に含まれる変数が p_{6}  のみとなるため、設定6である確率の範囲がダイレクトに出せそうである しかしそんな親切なパチンコ屋は存在しないだろう

 

6.さらに改良

なんとかして個々の確率の値の範囲を出せないだろうか?と思いながら機種ごとのブドウ率を眺めていると、あることに気がついた

 

アイムジャグラーEX

設定1 1/6.02

設定2 1/6.02

設定3 1/6.02

設定4 1/6.02

設定5 1/6.02

設定6 1/5.78

 

この機種は、設定1~設定5のブドウ率が全て同じであるらしい

w_{1}=w_{2}=w_{3}=w_{4}=w_{5} ということである

 

これを先ほどの

s=w_{1}+(w_{2}-w_{1})p_{2}+(w_{3}-w_{1})p_{3}+(w_{4}-w_{1})p_{4}+(w_{5}-w_{1})p_{5}+(w_{6}-w_{1})p_{6}

に代入してみる

 

するとどうだろうか

なんと (w_{2}-w_{1})(w_{3}-w_{1})(w_{4}-w_{1})(w_{5}-w_{1}) の部分が全て0となり、 p_{2}p_{5} のタームが全て消えるのである

すなわち s=w_{1}+(w_{6}-w_{1})p_{6} であり、s に含まれるのが p_{6}  のみとなった!(オオ~)

 

これにアイムジャグラーのブドウ率 w_{1}=1/6.02w_{6}=1/5.78 を代入し、次の定理を得る

(定理2)

アイムジャグラーEXにおいて n ゲームの遊戯を行い、ブドウ率が \bar{p} であった場合、

確率 \alpha で以下の不等式が成り立つ:

(T_{2})      142.86 \Big( \bar{p} - 0.166 - \sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) \Big)  \le p_{6} \le 142.86 \Big(  \bar{p} - 0.166 + \sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) \Big)  

ただし、

p_{6}:その台が設定 6 である確率

 z( \beta ) :標準正規分布の上側 \beta

(式がデカすぎて枠からハミ出てる)

 

こうして、晴れて設定6の確率を推定する方法が得られた ただし定理2はアイムジャグラーEXにおいてのみしか使用できないので注意してほしい(設定1~5のブドウ率が一緒の機種って他にもあるのかな?)

 

7.使ってみよう

(例)アイムジャグラーEXを1000回遊んだところ、ブドウが173回出た この結果から、95%の確率で設定6がどのような範囲にあるか推定しよう

 

まずブドウ率 \bar{p} を計算する

 \bar{p}= \dfrac{173}{1000}=\dfrac{1}{5.78}

となり、なんと設定6と同じ値である

 

これはすごい結果が期待できそうである 80\% \le p_{6} \le 90\% ぐらいになってしまうのではないだろうか

 

(T_{2})      142.86 \Big( \bar{p} - 0.166 - \sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) \Big)  \le p_{6} \le 142.86 \Big(  \bar{p} - 0.166 + \sqrt{\dfrac{\bar{p}(1-\bar{p})}{n}} z \Big( \dfrac {1-\alpha}{2} \Big) \Big)  

ワクワクしながらこの式に n=1000  、 \bar{p}=\dfrac{1}{5.78}\alpha=0.95 を代入してみると...

 -234.92\% \le p_{6} \le 434.92\% 

となった

下限は負の値であり、上限に至っては100%を超えている 何の情報も与えない結果である

このように試行回数 n が少ない場合はガバガバな区間しか得られない しかし p_{6} の範囲は試行回数 n が増えるにつれて段々と狭くなっていき、n=2920 でやっと下限が0を超え、同時に上限が100%を下回り、初めて有意な結果が得られる

 

そして例えば試行回数 n=100000 の場合は、

 66.50\% \le p_{6} \le 133.50\% 

となる つまり66.50%以上の確率で設定6であると言える

10万回回してなお7割弱である 設定分布が未知である状態において確率を推定するということは、それほどに厳しいことなのだ

 

さらに何年もかけて n=10000000 回試行した場合、

 96.65\% \le p_{6} \le 103.35\% 

となる このレベルまでくれば、やっと胸を張って設定6ですと言えるだろう

 

なお、不等式が成り立つ確率 \alpha(信頼度という)を下げると、その分範囲も狭くすることができる   z \Big( \dfrac {1-\alpha}{2} \Big) が小さくなるからである 逆に \alpha を上げると範囲は広がってしまう 信頼度と範囲はトレードオフの関係にあるのである

 

8.最後に

以上、実用的ではないかもしれないが、数学的に正しいと思われる設定推定の理屈を紹介した

もしかしたら細かい計算のミスがあるかもしれないが、考え方自体に誤りはないはずである

なお全く同様の考え方で仮説検定も可能である その他、t分布等を用いた区間推定ができないかについても検討していきたいと考えている(了)