標準偏差って何? 公差設計で生産バラツキを統計学的に考える3D設計推進者の眼(30)(3/3 ページ)

» 2018年04月26日 13時00分 公開
前のページへ 1|2|3       

正規分布と用語――標準偏差とは

 さて、一般的によく見られる「左右対称型」の分布の例では、サンプル数を2倍に、データ区分を2分の1にすることで、ヒストグラムの分布は細分化されて、中心的な分布を持ち、そこを頂点とする“滑らかな”山の形に変化しました。サンプル数を増やし、データ区分を狭くする、例えば、測定部品数を「限りなくたくさん、無限大に」、データ区分を「限りなく狭く(細かく)、0に近づけていく」とどうなるのでしょうか。

 この場合、その分布は“とても滑らかな曲線を描く形”となりますが、それが「正規分布」です。このような流れの中で、正規分布というものを定義したわけですが、公差計算と公差解析の中で使用する正規分布についてお話する上で、外しては語ることのできない“用語”についてだけ、そのお話をすることにします。

母集団

 情報を得たいと考える“モノ”、この例では該当部品の全てを示します。全数検査が義務付けられていれば、全てを測定することになりますが、大量生産を行うような場合は、“抽出”により測定することも多いと聞きます。全てを測定するのであれば、その測定値から得られる平均値や分布は高い精度を得ることが可能です。

サンプル

 母集団を構成する全てを測定する場合もあれば、現実的にできない時など母集団の中から“抽出”を行う場合があり、これを「サンプル」としました。このようなサンプルから平均値や分布を得ることで、母集団を想像します。

平均値

 平均値はまさに得られた値の平均値ですが、母集団から得たものと、サンプルから得たものは記号によって区別します。また以下のように表します。

  • 母集団から得た平均値:μ
  • サンプルから得た平均値:

標準偏差

 ばらつきの大きさを数値で示したものになります。これもまた、母集団から得たものと、サンプルから得たものを記号によって区別します。

  • 母集団から得た標準偏差:σ
  • サンプルから得た標準偏差:S

 さて、私としては、この「標準偏差」といわれるところから、「ん?」と思うのですが、皆さんはいかがですか?

 まず標準偏差の話の前に、「偏差」とは何でしょうか? 偏差とは個々のデータ(例では測定値)とそのデータの平均値の差になります。言い換えると、「個々のデータは平均値からどれだけ離れているか」で、その大きさを表すわけです。

 では、個々のデータの全部の偏差を求めた後に、「その平均を取って測定データの偏差の平均を“ばらつきの大きさの平均値”として見てみよう」だなんて考えてみます。実はこれが「標準偏差」になります。

 偏差はプラスになる場合も、マイナスになる場合もあります。平均値よりも小さな測定データの偏差はマイナスになり、平均値よりも大きな測定データの偏差はプラスになります。これらの偏差を全て足そうとすると、左右対称型のヒストグラムの分布の形を示している場合、すなわち正規分布となっている場合には、偏差の合計がゼロになってしまうので、全体(母集団であってもサンプルであっても)のばらつきの大きさを示す指標としてはどうにも使えなさそうです。

 ということで、偏差を2乗して足し算をすることでゼロにならないようにして、平均を求めたものが、標準偏差となります。ちなみにこの偏差の合計は2乗された値です。単位系も2乗(例ではmm2)になってしまっているので、平方根(√)で元の単位(mm)に戻します。偏差の合計を測定数で割りたいところですが、この標準偏差を求める際の分母は測定の数(母集団の数・サンプルの数)ではなく、測定の数から1個引いた数になります。この数を「自由度」といいます。

自由度

 標準偏差を求めるために割る数で、「測定数(母集団数・サンプル数)n−1[個]」というように決まっています。なぜかと理解するのは、私自身難しいのですが、こんなイメージです。

 あるサンプルで平均値を求めたとしましょう。例とするとサンプルデータが5個あります。そのサンプルデータの値は見えていませんが、平均値が10という値だということは分かっているとします。では、そのサンプルデータの値を“自由に”決めようとした場合、4個を決めることはできますが、残り1個は4個の値の結果決められるものであって「自由ではありません」ということから「自由度をn−1とした」ということでいかがでしょう。

 ということで、標準偏差は次のような数式で表されます。

 母集団の標準偏差とサンプルの標準偏差は記号で区別するというお話をしましたが、サンプルから得られたものを“正規分布”として“見なす”場合には、これを区別せずに母集団の標準偏差σとして表示します。これがサンプルから母集団を想像するということだと筆者は解釈しています。測定値例でのデータから、平均と標準偏差を求めてみました。

平均・標準偏差・分散を求めてみた例(構造計画研究所「Minitab17」使用)

 測定値と求めた平均と標準偏差から分布のグラフを作成してみました。なお、グラフ中に別途記載しましたが、正規分布の意味である「Normal Distribution」を示す大文字の「N」とともに平均値μと標準偏差σも合わせて表記してみました。

正規分布のグラフの例(構造計画研究所「Minitab17」使用)

 この表示の中には、標準偏差σの2乗が示されていますが、これは何でしょう? これが「分散」といいます。

分散

 簡単にいえば、「標準偏差の二乗=分散」です。「その意味は?」と思うのですが、私の解釈では、偏差は個々のデータが平均からどれだけ離れているかというものに対し、偏差の2乗の和の平均化は、「このサンプルもしくは母集団がどんな状態なのかということを示すのではないかな?」としています。


 今回の例ではサンプル数が全ての数を示す母集団になりましたが、サンプルから母集団を想像するという統計学の考え方から正規分布を考えるということもできることができます。正規分布のお話はもう少しだけ続けたいと思います。次回をお楽しみに。

(次回に続く)

Profile

土橋美博(どばし・よしひろ)

1964年生まれ。25年間、半導体組み立て関連装置メーカーで設計・営業・3次元CAD推進を行う。現在、液晶パネル製造装置を主体に手掛ける株式会社飯沼ゲージ製作所で3次元CADを中心としたデジタルプロセスエンジニアリングの構築を推進する。ソリッドワークス・ジャパンユーザーグループ(SWJUG)の代表リーダー・事務局も務める。



前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.