検索
連載

食わず嫌いを直そう、小学生の知識で統計データを可視化する(その3)山浦恒央の“くみこみ”な話(75)(2/2 ページ)

「統計」と聞くと頭が痛くなる人も多いかと思いますが、「今持っている知識でも何とかなる」ものです。その第一歩として、簡単なデータの可視化手法について紹介します。

Share
Tweet
LINE
Hatena
前のページへ |       

4.図による表現

 表.2で作成した度数分布表を図で表すと、データの傾向をさらに把握しやすくなります。いろいろな種類の図がありますが、今回は「ヒストグラム」を使用します。

 ヒストグラムは、縦軸に度数、横軸に階級を取って表す図で、あらゆる分野で使える「グラフの王様」です。直感的にデータの大小や傾向が分かるので、言葉や文字を認識できない赤ん坊でも、「大きい物」を選べそうです。「視覚的に分かりやすい」という極めて原始的な感覚は、データを分析する上で非常に重要です。

 ヒストグラムの作成には、Excelにアドインの分析ツールを使用すると、簡単に作成可能です。表.2をヒストグラムで表すと以下の図になります。

photo
図1 ヒストグラムの例
表.1 クラスの身長データ
あるクラスの生徒の身長 136 cm、138 cm、139 cm、144 cm、141 cm、142 cm、143 cm、142 cm、146 cm、146 cm、151 cm

 表.1と図.1を比較してください。同じ内容なのに、見え方は全くの別物です。今持っている知識や経験を使うだけで、これだけ大きい違いが出ます。グラフで表すと、「140〜145」にデータが偏っていることや、データが中心にある傾向を把握でき、表.1では分かりにくいデータの傾向が容易に理解できます。

 グラフによる図式表現は小学校でも学習することですが、ソフトウェア開発のデータ解析でも非常に有効な手法となります。この強力な利点を再認識して頂ければ幸いです。非常に簡単にできることですが、視覚的にデータを解析でき、強力なツールになります。

 ソフトウェア開発系において、ヒストグラムを使用した度数分布表は、例えば、縦軸をプロジェクトの件数、横軸をステップ数やFPとして、どの程度の規模のプロジェクトが何件あるかなど、全体を把握する場合などに便利です。

 今回は、ヒストグラムを使用しましたが、Excelでは、折れ線グラフ、円グラフ、レーダーチャートなど、他の図もありますので、状況やデータの特性に合わせていろいろな図を使用してみるとよいでしょう。クリック1回で、同じデータがいろいろな図式表現に変化します。この強力なツールを利用しないのはもったいないのです。

5.終わりに

 今回は、度数分布表とヒストグラムを使用した簡単なデータ分析の方法を紹介しました。数学的手法を使用した分析も重要ですが、今ある知識だけでも簡単なデータ分析は可能です。また、ヒストグラムは、開発時の問題発見の可視化にも使用していますので、改善活動の一環として適用するのも良いでしょう。

 次回は、平均や標準偏差など、少し難しそうな(難しそうに見える)統計手法の基本を紹介します。

参考文献

『まずはこの一冊から 意味がわかる統計解析』 (涌井貞美 著、2013年、ベレ出版社)



【 筆者紹介 】
山浦 恒央(やまうら つねお)

東海大学 大学院 組込み技術研究科 准教授(工学博士)


1977年、日立ソフトウェアエンジニアリングに入社、2006年より、東海大学情報理工学部ソフトウェア開発工学科助教授、2007年より、同大学大学院組込み技術研究科助教授、現在に至る。

主な著書・訳書は、「Advances in Computers」 (Academic Press社、共著)、「ピープルウエア 第2版」「ソフトウェアテスト技法」「実践的プログラムテスト入門」「デスマーチ 第2版」「ソフトウエア開発プロフェッショナル」(以上、日経BP社、共訳)、「ソフトウエア開発 55の真実と10のウソ」「初めて学ぶソフトウエアメトリクス」(以上、日経BP社、翻訳)。


Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る