このようにデータをヒストグラムにまとめてみると特性値の分布の形がよく分かります。ところが、その形が中心に密集しているとか、左右対称であるとか、幅(広がり)が大きい、というような定性的な評価・表現では、人によって判断が異なります。
そこで、誰もが一定の評価ができるように、これらを数量化して表すようにします。さらに深く分布の形を調べていくには、分布を数量で表す必要があります。
代表的な数値化の例として、平均値は分布の中心的傾向を表し、分散(σ2またはs2)や標準偏差(σまたはs)あるいは範囲(R)はバラツキの度合いを表すときに用いられます。標準偏差の表し方として使用されるギリシャ文字σ(シグマ)は、英文字ではsのことで、標準偏差(standard deviation)の頭文字ですので、どちらも同じ意味で使用されますが、ここではσを用いて説明します。次に、これらの求め方について述べます。
一般に、平均値は、次式で求められます。
また、標準偏差(σ)は次式で求められますが、下記の算式で求めた分散(σ2)の正の平方根を標準偏差(σ)と呼びます。
Copyright © ITmedia, Inc. All Rights Reserved.