検定と推定の考え方

検定と推定の考え方
(How to think about testing and estimation)

 

スポンサーリンク

アフィリエイト広告を利用しています。

1. 統計的推定

統計的推定とは,全体集団(母集団)から、ランダムに(無作為に)採り出されたサンプルを統計的に取り扱うことにより、全体集団の性質(母数)を推定することをいいます。これは統計学上、推定統計学と呼ばれる分野の考え方です。私たちが今SQC(統計的品質管理;Statistical Quality Control)で使っている統計学はこれに属します。

推定など面倒なので、母集団の全部のデータを統計的に処理すればよいのではとの考え方もありますが、私たちが製造している製品は大量にあり、全部を測定することは物理的に不可能です。
また、データを取る際に測定のため測定対象の状態を変更してしまい、製品として使用できない場合(破壊検査)もあります。

そこで、サンプルから母集団の性質を推定できているかを検討するために、統計的推定という概念が生まれました。
統計上、ある現象が起こる確率が偶然とは考えにくい(これを有意といいます)と判断する基準となる確率を危険率(有意水準ともいいます)といい、記号を\( \alpha \)で表します。危険率を\( \alpha \)とすると、信頼率は\( ( 1 – \alpha ) \)となります。百分率で表わしますと危険率が\( 100 \alpha \)[%]、信頼率が\( 100 ( 1 – \alpha ) \) [%]になります。

これを、箇条書きで示すと、
 ① 有意:統計上、ある現象が起こる確率が偶然とは考えにくいこと。
 ② 危険率:統計上、ある現象が起こる確率が偶然とは考えにくいと判断する基準(有意水準)。
      通常、記号\( \alpha \)で表します。%で示す場合は100を乗じます。
 ③ 信頼率:全体から危険率を引いたもの。\( ( 1 – \alpha ) \)になります。%で示す場合は100を乗じます。

計量値データの推定は(一般に検定も)、正規分布を仮定し母平均あるいは母分散についての推定(検定)を行います。また、計数値データの推定(検定)では、不適合品数(不良品数)や不適合品率(不良品率)などは一般に二項分布を、不適合数(欠点数)不適合率(不良率)などは通常ポアソン分布を想定して推定(検定)を行うことが多くなります。

余談ですが、このように、サンプルから母集団の様相を推定する推定統計学とは異なり、サンプルそのものをデータとしてその性質を考える記述統計学と呼ばれるものがあります。これはデータの特徴を理解するうえで重要で、推計統計学の基礎になるものです。
さらに、歴史的には古いベイズ統計学というものがあります。これは事前に統計量を予測しておき、新たなデータを入手したら、更新していくという考え方に基づく統計学です。この考え方は、コンピュータによる機械学習などデータが常に更新されるような場合に、元の母集団についての観測内容を常にアップデートできるため、ビッグデータを扱う分野でよく使われるようになっています。

2. 仮説の検定

仮説の検定とは、ある仮説が正しいと判断しても良いかどうかを、統計的・確率論的に判断するための手法です。統計学的仮説検定や、仮説検定、検定法ともいいます。
やり方は、仮説が正しいと仮定したうえで、それに従う母集団から、実際に観察されたサンプルが 抽出される確率を求めて、その値により判断します。求められる確率が、あらかじめ決めておいた値よりも小さければ、「仮説は成り立ちそうもない」と判断することができます。
具体的な手順は、別項で示します。

3. 母集団と標本

母集団とは、統計的操作を行う際に、サンプル(標本)を抽出する元になる集団を言います。母集団には無限母集団と、有限母集団とがあります。工場でのものづくりで考えると、工程は無限母集団、その工程での例えば1日で製作される部品や製品全体は有限母集団になります。
サンプル とは,母集団全てを調査できない場合に母集団の一部について調査するために抽出される調査対象をいいます。言い換えれば、本来調査すべき対象となる大きな集団を母集団、そこから抽出されて統計的な処理を行うデータがサンプルになります。
母数とは、母集団や確率変数の性質を代表する定数(パラメータ)のことです。例えば、正規分布をする母集団では、母平均\( \mu \)や母分散\( \sigma^2 \)が母数になります。
母集団のある種の母数が未知の場合、サンプル(標本)\( x_{1}, x_{2}, \cdots , x_{n} \) から得られる値\( f ( x_{1}, x_{2}, \cdots , x_{n} ) \) により、この未知の母数を推定する場合、\( f ( x_{1}, x_{2}, \cdots , x_{n} ) \) を推定値といいます。また、\( f ( X_{1}, X_{2}, \cdots , X_{n} ) \) のように、確率変数\( X_{1}, X_{2}, \cdots , X_{n} \) の関数として表すときは推定量といいます。つまり、すなわち推定値は、推定量\( f ( X_{1}, X_{2}, \cdots , X_{n} ) \)  の \( X_{i} \)に標本の値\( x_{i} \)を代入した値をいいます。

4. 検定の手順

仮説検定は次のような手順で実施します。検定の具体的な手順は2項で示します。

(1)仮説の設定:

仮説が正しいと仮定した場合に、その標本が観察される確率を算出できるように、仮説を統計学的に表現します。二つの集合の平均値が異なることを言いたい場合を例として考えてみます。

 \( H_{0} \):「集合Aの測定値と集合Bの測定値は、どちらも正規分布に従い、その標準偏差は両者で等しく、平均も等しい。」

という仮説を立てます。この仮説は最終的に棄却されるべきものなので、帰無仮説と呼ばれ、通常\( H_{0} \) と書きます。つまり、帰無仮説は間違っているといいたいことを仮説にします。
また帰無仮説に対立する仮説(対立仮説:\( H_{1} \))を立てることも多く、上の例では対立仮説は、次のようになります。

 \( H_{1} \):「集合Aの測定値と集合Bの測定値は、どちらも正規分布に従い、その標準偏差は両者で等しいが、平均は異なる。」
   
一般的には、対立仮説が本来証明したい仮説になります。

(2)統計量の算出:

サンプルデータから、仮説に関係した情報を要約する検定統計量を計算します。このような統計量を十分統計量といいます。

(3)統計量の確率分布:

仮説に基づき、検定統計量の確率分布を明らかにします。

(4)危険域の設定:

可能な全ての値の集合の中で、仮説に反する極端な範囲(グラフ表示した分布関数のすそ(裾)の部分)を選びます。この部分は検定統計量の「危険域」と呼ばれます。仮説が正しい場合に検定統計量が危険域内に入る確率を、「検定の危険率」と呼びます。
危険率をαとして、具体的には0.05(5%),0.01(1%)などを用いることが多いです。
また、この危険域のことを棄却域ともいいます。この危険域(棄却域)の取り方は検定の方法により、両側検定と片側検定とがあります。
両側検定の場合は、検定統計量の確率分布の両側にα/2ずつの危険域がある場合をいいます。これに対して、右側だけ、あるいは左側だけにαの危険域があるとして検定を行うのを片側検定といいます。
なお、両側検定の場合の仮説を両側仮説、片側検定の場合の仮説を片側仮説といいます。

図1 両側検定、片側検定それぞれの場合の棄却域の考え方 出典:よくわかる2級QC検定合格テキスト

(5)判定:

データから算出した十分統計量が危険域内にあるかどうかを判定します。
通常は統計量が仮定した分布の中で、算出した十分統計量と同じか、それよりも極端な(仮説に反する)値となる確率(これを \( p \)値といいます)を数表などによって求めて、これと\( \alpha \) とを比較し、\( p < \alpha \)ならば危険域の内部にあると判断します。

① 検定統計量が危険域内にある場合:

結論は、次の(a)あるいは(b)の二つが考えられることになります。

(a)仮説は正しくない。従って帰無仮説を棄却します。このことより、危険域のことを棄却域と
もいいます。それ以外の範囲\( ( 1 – \alpha ) \)は、採択域ということがあります。
(b)\( \alpha \)以下の低い確率でしか起こらない事象が起こった。

このような場合を、\( \alpha \)水準で統計学的に有意であるといいます。この例では「集団 A の測定値と集団 Bの測定値が等しいことは、\( \alpha \)水準で統計学的に有意である」と言えます。わかりやすく言い換えると、「このようなことは偶然に起こりそうもないが、ごく小さい確率\( \alpha \)では起こりうる」ということになります。

② 検定統計量が危険域の外側(採択域)にある場合:

仮説を棄却するだけの証拠はないという結論となります。統計学の目的は、科学的な真理を明らかにすることではなく、統計的な情報管理の立場から推論の誤りをできるだけ減らすことにあります。

5. 誤りの分類

帰無仮説が真である場合に、対立仮説を真と思ってしまう判断の誤りを、第1種の誤り(第1種の過誤、あわてものの誤り)といい、その確率は通常の危険度\( \alpha \)ということになります。

一方、対立仮説が真である場合に、帰無仮説が真であると思ってしまう判断の誤りを、第2種の誤り(第2種の過誤、ぼんやりものの誤り)といい、その確率は通常\( \beta \)で表わします。一般に\( \alpha \)を大きくすると\( \beta \)は小さくなり、\( \alpha \)を小さくすると\( \beta \)は大きくなります。

検定では、対立仮説が真である時にそれを正しく検出できることが重要ですので、その確率である\( ( 1 – \beta ) \)を検出力ということもあります。\( \alpha \)は「めったに起こらない確率」という意味を持ちますので、前述のように一般的に5%あるいは1%が用いられます。

つまり、帰無仮説\( H_{0} \)が正しいのに誤りとするのが、第1種の誤り(あわてものの誤り)で、帰無仮説が誤りなのに正しいとするのが、第2種の誤り(ぼんやりものの誤り)になります。

表2 検定における第1種の誤りと第2種の誤り  ORIGINAL

6. 点推定と区間推定

点推定とは,「母平均\( \mu \) や母分散\( \sigma^2 \)などの一つの値を推定すること」で、一般にはサンプルの不偏推定量としての平均値\( \overline{X} \) や分散\( V \)などが用いられます。
また、区間推定とは、「推定値がどの程度信頼できるかについて区間を用いて推定すること」をいい、 信頼率を設定して推定します。一般にその信頼率としては95%(0.95)あるいは90% (0.9)などが用いられ、信頼限界(信頼区間の上限値や下限値)を求めます。

 

参考文献
よくわかる2級QC検定合格テキストー改訂3版―  福井清輔  弘文社 2022年

 

引用図表
図1 両側検定、片側検定それぞれの場合の棄却域の考え方 出典:よくわかる2級QC検定合格テキスト
表2 検定における第1種の誤りと第2種の誤り  ORIGINAL

ORG:2024/06/11