表.2で作成した度数分布表を図で表すと、データの傾向をさらに把握しやすくなります。いろいろな種類の図がありますが、今回は「ヒストグラム」を使用します。
ヒストグラムは、縦軸に度数、横軸に階級を取って表す図で、あらゆる分野で使える「グラフの王様」です。直感的にデータの大小や傾向が分かるので、言葉や文字を認識できない赤ん坊でも、「大きい物」を選べそうです。「視覚的に分かりやすい」という極めて原始的な感覚は、データを分析する上で非常に重要です。
ヒストグラムの作成には、Excelにアドインの分析ツールを使用すると、簡単に作成可能です。表.2をヒストグラムで表すと以下の図になります。
表.1 クラスの身長データ | |
---|---|
あるクラスの生徒の身長 | 136 cm、138 cm、139 cm、144 cm、141 cm、142 cm、143 cm、142 cm、146 cm、146 cm、151 cm |
表.1と図.1を比較してください。同じ内容なのに、見え方は全くの別物です。今持っている知識や経験を使うだけで、これだけ大きい違いが出ます。グラフで表すと、「140〜145」にデータが偏っていることや、データが中心にある傾向を把握でき、表.1では分かりにくいデータの傾向が容易に理解できます。
グラフによる図式表現は小学校でも学習することですが、ソフトウェア開発のデータ解析でも非常に有効な手法となります。この強力な利点を再認識して頂ければ幸いです。非常に簡単にできることですが、視覚的にデータを解析でき、強力なツールになります。
ソフトウェア開発系において、ヒストグラムを使用した度数分布表は、例えば、縦軸をプロジェクトの件数、横軸をステップ数やFPとして、どの程度の規模のプロジェクトが何件あるかなど、全体を把握する場合などに便利です。
今回は、ヒストグラムを使用しましたが、Excelでは、折れ線グラフ、円グラフ、レーダーチャートなど、他の図もありますので、状況やデータの特性に合わせていろいろな図を使用してみるとよいでしょう。クリック1回で、同じデータがいろいろな図式表現に変化します。この強力なツールを利用しないのはもったいないのです。
今回は、度数分布表とヒストグラムを使用した簡単なデータ分析の方法を紹介しました。数学的手法を使用した分析も重要ですが、今ある知識だけでも簡単なデータ分析は可能です。また、ヒストグラムは、開発時の問題発見の可視化にも使用していますので、改善活動の一環として適用するのも良いでしょう。
次回は、平均や標準偏差など、少し難しそうな(難しそうに見える)統計手法の基本を紹介します。
東海大学 大学院 組込み技術研究科 准教授(工学博士)
Copyright © ITmedia, Inc. All Rights Reserved.