二項分布(binomial distribution)
二項分布(binomial distribution)
スポンサーリンク
アフィリエイト広告を利用しています。
目次
1. 二項分布とは
二項分布とは、結果が成功か失敗かの何れかである試行(ベルヌーイ試行)を独立にn回行ったときの成功回数を確率変数とする離散型確率分布をいいます。ここで、各試行における成功の確率をP で表し、一定とします。
不適合品の確率がP の母集団から大きさn のサンプルを抜き取った際に、その中に不適合品がx 個入っている確率は、次式で表されます。これを不適合品の確率二項分布といいます。
\( P_{ r } ( X = x ) = {}_n \mathrm{ C }_k P^x ( 1 – P )^{ n – x } = \displaystyle\frac{ n! }{ x! ( n – x )! } P_{ x } ( 1 – P )^{ n – x } \)
このときの期待値(平均)\( E(X) \)と標準偏差\( D(X) \) は
\( E(X) = nP \)
\( D(X) = \sqrt{ nP( 1 – P ) } \)
また二項分布は、以下の条件が成立する場合、正規分布に近似できます。
\( nP \geq 5 , n( 1 – P ) \geq 5 \)
なお、不適合品率 \( P = X/n \) も二項分布に従います。この場合の期待値(平均)と標準偏差は、次式のようになります。
\( E(p) = P \)
\( D(p) = \sqrt{ \displaystyle\frac{ P( 1 – P ) }{ n }} \)
2. 二項分布の検定統計量
(1)一つの母集団に対する検定統計量
二項分布の基本統計量は、正規分布の検定統計量\( u_{ 0 } \) をベースに考えましょう。
正規分布の検定統計量\( u_{ 0 } \) を考えると、
\( u_{ 0 } = \displaystyle\frac{ \overline{ x } – \mu_{ o } }{ \displaystyle\frac{ \sigma }{ \sqrt{ n } }} = \mathtt{ \displaystyle\frac{ 標準平均 – 母平均 }{ \displaystyle\frac{ 母標準偏差 }{ \sqrt{ サンプル数 } }}} \)
になります。
これを二項分布に当てはめると、「標本平均」は「抽出したサンプルの中で注目する事象の発生する回数」と考えられます。これは、二項分布では「期待値」を表し、\( \overline{ x } \Rightarrow nP \) となります。
すなわち、
発生回数 = サンプル数n × 発生確率P
を意味します。
次に、「母平均」は、二項分布で考えると、「注目する事象の発生する回数」に相当します。つまり正規分布の母平均に相当するのは、サンプル数に関係の無い「真の不適合品の確率」になります。
これを\( P_{ 0 } \) とすると、二項分布の母平均は、
\( \mu_{ 0 } \Rightarrow nP_{ 0 } \)
になります。
母標準偏差は、母分散を平方したものですから、、二項分布の母標準偏差は、
\( \sigma \Rightarrow \sqrt{ nP_{ 0 } ( 1 – P_{ 0 } ) } \)
になります。
従って、二項分布の発生回数に対する検定統計量は、
\( u_{ 0 } = \displaystyle\frac{ nP – nP_{ 0 } }{ \sqrt{ P_{ 0 } ( 1 – P_{ 0 } ) }} \)
となります。
ただ、二項分布の検定統計量は、不適合品率の期待値、分散を用いた、発生確率に対する検定統計量の方が一般的です。これを次式に示します。
\( u_{ 0 } = \displaystyle\frac{ P – P_{ o } }{ \displaystyle\sqrt\frac{ P_{ 0 } ( 1 – P_{ 0 } ) }{ n }} \)
すなわち、\( \overline{ x } \Rightarrow P、\mu \Rightarrow P_{ 0 }、\sigma = \sqrt{ P_{ 0 } ( 1 – P_{ 0 }) } \) と変換されます。
帰無仮説H0 を棄却する条件(有意とする条件)
・対立仮説H1: P ≠ P0のとき |u0| ≧ u(0,05) ならばH0を棄却
・対立仮説H1: P > P0のとき u0 ≧ u(0.10) ならばH0を棄却
・対立仮説H1: P < P0のとき u0 ≦ -u(0.10) ならばH0を棄却
※ u(0.05) = 1.96、u(0.10) = 1.645
(2)二つの母集団に対する検定統計量
二つの母集団の二項分布の検定統計量は次式で示されます。
\( u_{ 0 } = \displaystyle\frac{ P_{ A } – P_{ B } }{ \sqrt{ \overline{ P } ( 1 – \overline{ P }) \left( \displaystyle\frac{ 1 }{ n_{ A }} + \displaystyle\frac{ 1 }{ n_{ B }} \right) }} \)
ここで、
\( \overline{ P } \):集団Aと集団Bとをあわせて、注目する事象の発生する確率
\( n_{ A } \):集団Aのサンプル数
\( n_{ B } \):集団Bのサンプル数
\( P_{ A } \):集団Aで注目する事象の発生する確率
\( P_{ B } \):集団Bで注目する事象の発生する確率
\( x_{ A } \):集団Aで注目する事象の発生する回数
\( x_{ B } \):集団Bで注目する事象の発生する回数
また、\( \overline{ P } \) は、次式で表されます。
\( \overline{ P } = \displaystyle\frac{ x_{ A } + x_{ B } }{ n_{ A } – n_{ B } } \)
二つの母集団の検定推定量は、それらの母集団の違いを比べるものです。二つの母集団を、AとBとするとそれぞれの基本統計量は次の様に表されます。
\( u_{ 0A } = \displaystyle\frac{ P_{ A } – \overline{ P } }{ \displaystyle\sqrt\frac{ \overline{ P } ( 1 – \overline{ P } ) }{ n_{ A } }} u_{ 0B } = \displaystyle\frac{ P_{ B } – \overline{ P } }{ \displaystyle\sqrt\frac{ \overline{ P } ( 1 – \overline{ P } ) }{ n_{ B } }} \)
一つの母集団に対する検定統計量と比較すると、\( P_{ 0 } \) が\( \overline{ P } \) になっています。これは、一つの検定統計量では真の不適合品の確率になりますが、この場合ではAとBを合わせた全体での確率に置き換えられるためです。これは、AとBとを合わせた母集団から見て、母集団AとBに差異があるか否かの検定・推定をするためです。
AとBとの差ですから、検定統計量の分子の部分は、
\( u’_{A} – u’_{ B } = ( P_{ A } – \overline{ P } ) – ( P_{ B } – \overline{ P } ) = P_{ A } – P_{}\)
分母についても同様に考えると
\( u^{ \prime\prime }_{ A } – u^{ \prime\prime }_{ B } = \displaystyle\frac{ 1 }{ \sqrt{ \overline{ P } ( 1 – \overline{ P }) \left( \displaystyle\frac{ 1 }{ n_{ A }} + \displaystyle\frac{ 1 }{ n_{ B }} \right) }} \)
ここでは、分散(ばらつき)の加法性が考慮しなければなりません。
これにより。二つの母集団の二項分布の検定推定量は、次式で表されることになります。
\( u_{ 0 } = \displaystyle\frac{ P_{ A } – P_{ B } }{ \sqrt{ \overline{ P } ( 1 – \overline{ P }) \left( \displaystyle\frac{ 1 }{ n_{ A }} + \displaystyle\frac{ 1 }{ n_{ B }} \right) }} \)
帰無仮説H0 を棄却する条件(有意とする条件)
・対立仮説H1: λ ≠ λ0のとき |u0| ≧ u(0,05) ならばH0を棄却
・対立仮説H1: λ > λ0のとき u0 ≧ u(0.10) ならばH0を棄却
・対立仮説H1: λ < λ0のとき u0 ≦ -u(0.10) ならばH0を棄却
※ u(0.05) = 1.96、u(0.10) = 1.645
3.二項分布の点推定と区間推定
(1)一つの母集団に対する点推定と区間推定
① 点推定
\( \hat{ P } = \displaystyle\frac{ x }{ n } \)
② 区間推定
95%信頼区間は以下のようになります。
\( P_{ L } = P – u(\alpha / 2 ) \times \sqrt{ \displaystyle\frac{ P ( 1 – P ) }{ n }} \)
\( P_{ U } = P + u(\alpha / 2 ) \times \sqrt{ \displaystyle\frac{ P ( 1 – P ) }{ n }} \)
点推定について考えると、「注目する事象の発生回数 x 」を、「全試行回数 n 」で割ることは、P を標本から得られた、「注目する事象の発生する確率」を「真の確率」とみなすことになります。
区間推定については、正規分布の区間推定の範囲については次式で表されます。
\( \overline{ x } \pm u(alpha / 2 \times \displaystyle\frac{ \sigma }{ \sqrt{ n }} \)
ここで、母標準偏差\( \sigma \) ⇒ 標本標準偏差\( \sqrt{ P ( 1 – P )} \) になります。
これは、推定が抽出したサンプルを用いて行うものだからです。
(2)二つの母集団に対する点推定と区間推定
① 点推定
\( \widehat{ P_{ A } – P_{ B } } = P_{ A } – P_{ B } \)
② 区間推定
95%信頼区間は以下のようになります。
\( P_{ L } = ( P_{ A } -P_{ B } ) – u(\alpha / 2 ) \times \sqrt{ \displaystyle\frac{ P_{ A } ( 1 – P_{ A } ) }{ n_{ A } + \displaystyle\frac{ P_{ B } ( 1 – P_{ B } ) }{ n_{ B } }}} \)
\( P_{ L } = ( P_{ A } -P_{ B } ) – u(\alpha / 2 ) \times \sqrt{ \displaystyle\frac{ P_{ A } ( 1 – P_{ A } ) }{ n_{ A } + \displaystyle\frac{ P_{ B } ( 1 – P_{ B } ) }{ n_{ B } }}} \)
点推定については、抽出したサンプルに基づいて行うものだからです。\( P_{ A } – P_{ B } \) の値は、場合によりマイナスになりますが、標準正規分布は中心0に対して左右対称なので、標準正規分布表を用いることができます。
区間推定については、右辺2項目の標準偏差分については、分散(ばらつき)の加法性が成り立ちますので、二つの母集団の標準偏差をサンプル数の弊方で除したものの和になります。
スポンサーリンク
|
|
参考文献
よくわかる2級QC検定合格テキスト 福井清輔 弘文社
QC検定2級品質管理の手法50ポイント 内田治 日科技連
ORG: 2024/02/03