正規分布の話をする上では、その平均値μの位置は、これまで使用した正規分布のようにY軸上にあるということはありません。実は、これまで使用してきたものは、「標準正規分布(Standard Normal Distribution)」といわれるものになり、「平均値μ=0、標準偏差σ=1、分散σ2=1、N(0,12)」いうものになります。
上の図には、非常に単純な正規分布のグラフを示しています。この標準正規分布のグラフの横軸は、標準偏差の何倍になるかを示しています。そういうことから、±1の区間では1倍、±2の区間では2倍、±3の区間では3倍となります。
しかし、実際に正規分布になるヒストグラムをグラフ化すると、下図のようになるのではないでしょうか。
不良率を求めるためには「標準正規分布表」を使用します。標準正規分布表は「標準正規分布においてその値以上の値を取る確率」を示しています。くれぐれも、標準正規分布であることに注意してください。
標準正規分布のグラフを示しましたが、このように横軸には寸法などの変数、縦軸には確率密度が記載されているものに対して、横軸上の任意の値を規格値として「Kε(ケイ・イプシロン)」として、このKεを外れる、すなわちこのKεのグラフの外側になる確率を示した「ε(イプシロン)」を、標準正規分布表から求めることができます。この標準正規分布表ですが、Web上でもいろいろな場所で公開されていますが、自分でExcelを使って作成することも可能ですので、試してみてください。
例としては「Kε=1.11」とすると縦軸の0.1刻みの数値と、横軸の0.01刻みの数値の交差する位置から、「ε=0.133500」となり、1.11以上という数値になる確率は「0.133500」という数値を読み取ることが可能で、よって「13.35%」ということが統計学的に推測できます。
実際に測定した値は、この標準正規分布ではありません。しかし、平均値からのσの大きさに応じたデータの存在する確率は同じであると話しました。このことから、標準正規分布ではない分布からも、「統計学的にある規格値Kεを外れる確率εを推測することは可能」だということになります。これを行うために「正規分布の基準化」を行います。
Copyright © ITmedia, Inc. All Rights Reserved.