これまで、統計的方法が対象とするデータの性質と収集方法について解説してきましたが、連載第1回の最後に、統計的方法が対象とする統計量について紹介します。統計量とはデータから計算される値のことであり、平均値が最も有名な統計量です。さまざまな統計量がありますが、品質管理の分野で利用される統計量は、主に次の3つです。これらはすべてExcelで計算できます。
平均値(関数:AVERAGE) データの総和をデータ数で割った値。データの中心位置、いわゆる“平均”を意味する値。
分散(関数:VAR) データのバラツキの大きさを示す値。分散の値が高いほどバラツキが大きいことを意味する。品質のバラツキが大きい製品はほかの製品と比較して分散の値が高くなる。
標準偏差(関数:STDEV) データのバラツキの大きさを示す値。データの平均値からの平均的な距離で、標準偏差の値が高いほどバラツキが大きいことを意味する。単位は元のデータと同じ。例えば、平均身長170cm、標準偏差5cmのとき、その集団に属する人の身長の平均身長からの差は、平均で5cm程度になる。ちなみに標準偏差は分散の平方根と一致する。
Excelの関数という機能を使い統計量を計算してみます。次の画面のように測定データを入力した状態で、統計量を表示したいセルに関数を入力すると統計量が表示されます。
これら測定したデータ、すなわち標本から計算した統計量のことを、特に標本統計量(標本平均、標本標準偏差など)と呼ぶことがあります。標本統計量を真の値、すなわち母統計量と区別して考えることが、統計的方法を学ぶうえで重要です。
◇
以上が、第1回の内容です。品質管理と統計的方法の関係およびデータの収集方法と基本統計量について紹介しました。次回以降、標本データから母集団の状況を推測する統計的方法について紹介していきます。
Copyright © ITmedia, Inc. All Rights Reserved.