食わず嫌いを直そう、統計分析での「4つのデータ分類」(その2):山浦恒央の“くみこみ”な話(74)(3/3 ページ)
「統計」と聞くだけで及び腰になる気持ちも分かりますが、ツールの充実した今、そう難しいものではありません。第一歩として、統計における「数値の種類」について、理解を進めましょう。
5 データの種類の判別法
計測した数値が上記の4分類のどれになるか、簡単に見分ける方法を以下に解説します。
- (1)名義尺度
他の値と区別するための数字なので、数値を「a」「b」「c」に置き換えられる。加減乗除はできない。
- (2)順序尺度
数値を「a」「b」「c」に置き換えられないが、数値の大きさ(順番)の大小のみに意味があり、数値は等間隔で並ばない。生データとして「3.8」など、小数点のついた値はない。加減乗除はできない。
- (3)間隔尺度
原点(例えば0や1)は決まっていないが、数値は等間隔で並ぶ。小数点のついた値がある。加算、減算はできるが、乗算と除算はできない。
- (4)比例尺度
原点(例えば0や1)が決まっていて、数値は等間隔で並ぶ。加減乗除が可能。
6.終わりに
今回は、4種類のデータの尺度を説明しました。データを解析する前に、計測したデータがどの尺度に相当するか考え、それに合った計算手法を用いることが重要です。質的データと量的データを混合して計算することは非常に危険です(特に、順序尺度)。細心の注意を払ってデータを分類する必要があります。
統計アレルギーを解消するには、1つ1つの事柄を理解していく事にあると思います。焦らずゆっくり学習しましょう。
参考文献
『まずはこの一冊から 意味がわかる統計解析』 (涌井貞美 著、2013年、ベレ出版社)
『演習で学ぶソフトウエアメトリクスの基礎 ソフトウエアの測定と見積もりの正しい作法』 (リンダ・M・ライルド、M・キャロル・ブレナン著、2009年、日経BP社)
『ソフトウェアテスト技法』 (ボーリス・バイザー著、1994年、日経BP社
東海大学 大学院 組込み技術研究科 准教授(工学博士)
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 食わず嫌いを直そう、統計分析は意外に簡単(1)
ソフトウェア開発においてデータの重要性は言うまでもありませんが、「統計的に分析せよ」と言われると腰の引ける人も多いはずです。ですが、ツールの充実した今、そう難しいものではありません。まずは統計分析の「御利益」を知って、食わず嫌いを克服しましょう。 - 「悪いバグ」のケーススタディ(バグの少数例)
筆者の研究室で、ゲームに見られるバグの「悪いバグ」をさらに分類したところ、大きく分けて13種に分類できました。上位6種で75%を占めますが、今回は悪いバグの「少数派」について説明していきます。 - 「悪いバグ」のケーススタディ
ゲームのバグには「良いバグ」もあり、仕様となったり名物になったりすることもあります。ただ「悪いバグ」があることも事実で、筆者の研究室ではこれを分類することにしました。「悪いバグ」のケーススタディです。 - 「裏技」はゲームのスパイス
組み込み系の代表例の1つ、ゲームの世界ではバグが「良いバグ」と評価され、「裏技」と呼べる存在になることもあります。“バグが悪ではない”感覚は品質制御の世界観を広げてくれるはずです。 - 連載記事「山浦恒央の“くみこみ”な話」