連載
食わず嫌いを直そう、「平均値」だけが平均じゃない!(その5):山浦恒央の“くみこみ”な話(77)(3/3 ページ)
データ解析の王様ともいえる「平均値」ですが、それが本当に母集団の性質を表現しているかは確認すべき事項です。母集団によっては「最頻値」や「中央値」の採用を考慮すべきです。
3.4 4種類の「代表値」の分析
上記の生産性の代表値を算術平均値、中央値、最頻値、トリム平均値で計算すると次のようになります。
表.3 平均値、中央値、最頻値、トリム平均値の計算結果 | |
---|---|
算術平均 | 1552 |
中央値 | 834 |
最頻値(表.1) | 834 |
トリム平均値 | 891 |
今回の生産性データは、極端な外れ値があるため、算術平均ではなく、中央値、トリム平均値、最頻値のどれかを採用するのが現実的だと筆者は考えます。
膨大なデータに対し、上記の代表値を計算するのは面倒なようですが、Excel→「分析ツール」→「基本統計量」を使用すると、算術平均、中央値、最頻値は勝手に計算できますので、全ての特徴値を見てから、採用する代表値を判断すると良いでしょう。
4. 代表値のメリットとデメリットの一覧表
代表値(算術平均、中央値、最頻値)の特徴をまとめると以下のようになります[1]。
表.4 代表値のメリットとデメリット | ||
---|---|---|
代表値 | メリット | デメリット |
算術平均 | 全てのデータを有効に使える、結果は必ず1つ | 外れ値の影響を受ける |
中央値 | 外れ値の影響を受けない、結果は必ず1つ | 未使用のデータがある |
最頻値 | 外れ値の影響を受けない | 未使用のデータがある、最頻値が複数存在する場合がある、最頻値が存在しない場合がある |
以上のメリットとデメリットを把握できれば、目的に沿って現実的にデータを分析できます。
5. 終わりに
今回は、データの特徴を表す「代表値」について説明しました。4種類の代表値には、それぞれ得意・不得意がありますのでそれらに注意して使用すると効果的なデータ分析ができます。開発プロジェクトでのデータ分析で、ぜひ活用してください。
参考文献
[1] 『例題で学ぶ初歩からの統計学 第2版』 (白砂堤津耶 著、2015年、日本評論社)
『統計と確率ケーススタディ30―基礎知識と実戦的な分析手法』 (ニュートンムック Newton別冊)
『まずはこの一冊から 意味がわかる統計解析』 (涌井貞美 著、2013年、ベレ出版社)
【 筆者紹介 】
山浦 恒央(やまうら つねお)
東海大学 大学院 組込み技術研究科 准教授(工学博士)
1977年、日立ソフトウェアエンジニアリングに入社、2006年より、東海大学情報理工学部ソフトウェア開発工学科助教授、2007年より、同大学大学院組込み技術研究科助教授、現在に至る。
主な著書・訳書は、「Advances in Computers」 (Academic Press社、共著)、「ピープルウエア 第2版」「ソフトウェアテスト技法」「実践的プログラムテスト入門」「デスマーチ 第2版」「ソフトウエア開発プロフェッショナル」(以上、日経BP社、共訳)、「ソフトウエア開発 55の真実と10のウソ」「初めて学ぶソフトウエアメトリクス」(以上、日経BP社、翻訳)。
関連記事
- 食わず嫌いを直そう、統計計算の王様「平均値」の落とし穴(その4)
思わず身構えてしまう「統計」ですが、手をつけてしまえば何とかなるものです。今回はデータ解析手法の“王様”である「平均」について、解説します。 - 食わず嫌いを直そう、統計分析は意外に簡単(1)
ソフトウェア開発においてデータの重要性は言うまでもありませんが、「統計的に分析せよ」と言われると腰の引ける人も多いはずです。ですが、ツールの充実した今、そう難しいものではありません。まずは統計分析の「御利益」を知って、食わず嫌いを克服しましょう。 - 「悪いバグ」のケーススタディ(バグの少数例)
筆者の研究室で、ゲームに見られるバグの「悪いバグ」をさらに分類したところ、大きく分けて13種に分類できました。上位6種で75%を占めますが、今回は悪いバグの「少数派」について説明していきます。 - 「悪いバグ」のケーススタディ
ゲームのバグには「良いバグ」もあり、仕様となったり名物になったりすることもあります。ただ「悪いバグ」があることも事実で、筆者の研究室ではこれを分類することにしました。「悪いバグ」のケーススタディです。 - 「裏技」はゲームのスパイス
組み込み系の代表例の1つ、ゲームの世界ではバグが「良いバグ」と評価され、「裏技」と呼べる存在になることもあります。“バグが悪ではない”感覚は品質制御の世界観を広げてくれるはずです。 - 連載記事「山浦恒央の“くみこみ”な話」
Copyright © ITmedia, Inc. All Rights Reserved.