2項分布についての解説
コイン投げの試行を行ったとき、試行結果はオモテ面かウラ面のどちらかになる。このように試行結果が 2 種類しか取り得ない試行をベルヌーイ試行と呼びます。
このベルヌーイ試行をn回繰り返したとき、事象A(例えばコインの表が出る)の起こる回数Xの確率分布を二項分布といいます。
計算式とグラフは次の通りです。
$P(X=k)={}_n\mathrm{C}_kp^k(1-p)^{n-k}$
縦軸P(X)
横軸X
グラフをwikipediayより引用 作者名 Tayste File:Binomial distribution pmf.svg
内部統制の実施基準に書かれている、「許容誤謬率が9%」を当てはめてみましょう
例えば、ゆがんだコイン(表の出る確率がp=0.09、裏の出る確率がp-1=0.91とする)をn=25回投げた場合に、表がX回出る確率を計算してみます。
その確率の計算は本来であれば上記の計算式を使いますが、エクセルの関数で用意されているのでそれを使います。
確率 = BINOM.DIST(成功数,試行回数,成功率,関数形式)
表が出る回数X=0~25の確率をすべて計算してグラフにすると、次の通りです。
横軸X
グラフを見てわかる通り、表が2回でる確率が一番高いです。これは期待値np=25回×0.09=2.25回からもわかります。
実施基準にはサンプリングリスク10%(90%の信頼度)とすると書かれています。これは、発生する確率が10%未満の事象が生じたら異常ということです。その場合、前提としている、表の出る確率p=0.09が誤っているとみなせます。
例えば実際にコインを25回投げてみて一回も表が出なかった場合、P(X=0)=9.5%の確率の事象が起きてしまったことになりますので、表が出る確率p=9%は誤りとみなせるということになります。(統計の世界では帰無仮説を棄却するといいます)
また、表の出る回数が少ない方向の結果が出ているため、表が出る確率pは9%未満ということになります。
なお、X=24回で計算すると、次の通りです。
表が一回も出ない場合の確率P(X=0)が、0.104となります。これでは10%を超えているため、表が一回も出なかったとしても、表が出る確率p=9%を棄却できません。
表が出る確率p=9%であることが確かめられてしまいますので、n=24回では試行回数が足りないのです。
またn=42回で計算してみましょう。
表が一回も出ない場合の確率P(X=0)が、0.019、1回表が出る確率P(X=1)が0.079、合計して0.098となります。
この場合、0回でなく1回表が出たとしても、サンプリングリスクの10%未満ですので、表が出る確率p=9%を棄却できます。なので、1回表が出ても良いんですね。
このように、付録2の統計的サンプル数の例示が作成されています。
おわり