食わず嫌いを直そう、統計計算の王様「平均値」の落とし穴(その4):山浦恒央の“くみこみ”な話(76)(4/4 ページ)
思わず身構えてしまう「統計」ですが、手をつけてしまえば何とかなるものです。今回はデータ解析手法の“王様”である「平均」について、解説します。
4.終わりに
今回は、データ分析で平均値を使用する場合の注意点を解説しました。平均は、簡単で非常に強力なデータ分析手法ですが、いくつか注意点があります。データを分析する際に知っておくと、データの中のより深い情報を読み取れるようになります。
付録1.分散の求め方
あえて、統計計算の「茨の道」へ踏み込みたい勇気あるエンジニアのために、分散を求める手順を以下に記します。
- (1)各データと平均値の差を算出する。
- (2)それぞれの差を2乗し、加算する。
ここで2乗することがポイントです。あるプロジェクトの平均生産性が1,100で、エンジニアAが1300、エンジニアBが900だとすると、平均との単なる差は「200」と「-200」なので、加算するとゼロになります。これを避けるため2乗しています。
- (3)データを個数で割る。
この手順を、表.5のプロジェクトAのデータを使用して分散、標準偏差を求めた結果を表.7に示します。
表.7 あるプロジェクトのエンジニアの生産性(LOC) | |||
---|---|---|---|
名前 | チームAの生産性(LOC) | 平均値との差 | 平均値の2乗 |
エンジニアA | 850 | -106 | 11236 |
エンジニアB | 1090 | 134 | 17956 |
エンジニアC | 900 | -56 | 3136 |
エンジニアD | 1050 | 94 | 8836 |
エンジニアE | 890 | -66 | 4356 |
平均値 | 956 | - | - |
平均値の2乗の合計 | - | - | 45520 |
分散 | - | - | 9104 |
分散を計算する詳細手順は以下の通りです。上記の表を参考にして考えてください。
- (1) 各データと平均値の差を算出する
平均値 = (850 + 1090 + 900 + 1050 + 890) / 5となりますので、956です。次に、それぞれの値と平均値の差を求めます。(956 - 850) = -106、(1090 - 956) = 134, (900 - 956) = -56となります。
- (2) それぞれを2乗し、加算する
それぞれのデータを2乗し、加算します。つまり、( (-106)2 + (134) 2 + (-56) 2 + (94) 2 + (-66)2 ) = 45520となります。2乗する理由は、上述の通り、平均値との差がプラスマイナスを防ぐためです。例えば、( -106 + 134 - 56 + 94 - 66) / 5をすると0となってしまい、データのバラツキを表す指標が0になってしまいます。
- (3) データを個数で割る
平均値の2乗の合計をデータ数で割ります。(45520 / 5)となり、分散は9104となります。
付録2. 標準偏差の求め方
標準偏差は、分散値の平方根を取れば算出できます。付録1の(2)で、各データを2乗しました。標準偏差はその値を元に戻す作業と考えればよいでしょう。今回の場合は、√45520となり、約95となります。ルートの計算はエクセルのSQRT関数を使用すると簡単に計算が可能です。
東海大学 大学院 組込み技術研究科 准教授(工学博士)
関連記事
- 食わず嫌いを直そう、小学生の知識で統計データを可視化する(その3)
「統計」と聞くと頭が痛くなる人も多いかと思いますが、「今持っている知識でも何とかなる」ものです。その第一歩として、簡単なデータの可視化手法について紹介します。 - 食わず嫌いを直そう、統計分析での「4つのデータ分類」(その2)
「統計」と聞くだけで及び腰になる気持ちも分かりますが、ツールの充実した今、そう難しいものではありません。第一歩として、統計における「数値の種類」について、理解を進めましょう。 - 食わず嫌いを直そう、統計分析は意外に簡単(1)
ソフトウェア開発においてデータの重要性は言うまでもありませんが、「統計的に分析せよ」と言われると腰の引ける人も多いはずです。ですが、ツールの充実した今、そう難しいものではありません。まずは統計分析の「御利益」を知って、食わず嫌いを克服しましょう。 - 「悪いバグ」のケーススタディ(バグの少数例)
筆者の研究室で、ゲームに見られるバグの「悪いバグ」をさらに分類したところ、大きく分けて13種に分類できました。上位6種で75%を占めますが、今回は悪いバグの「少数派」について説明していきます。 - 連載記事「山浦恒央の“くみこみ”な話」
Copyright © ITmedia, Inc. All Rights Reserved.