統計の食わず嫌いを直そう(その9)、昼休みにタダで統計分析をする方法:山浦恒央の“くみこみ”な話(81)(1/3 ページ)
「統計分析」と聞くと面倒な感じですが、何を証明するか明確ならExcelで簡単にこなせます。Excelさえあれば追加費用はかからず、しかもランチタイムに終わるほどカンタンなのです。
ソフトウェア開発で生産性や品質を向上させるため、プロジェクトに新プロセスを導入する会社は多いと思います。上層部から改善効果を聞かれ、「まあまあいい感じで生産性が上がっていますよ」とテキトーに答えるのではエンジニア失格。統計的な分析手法を使い、具体的な数字をあげてカッコよく答えましょう。
統計的分析と聞くと「なんだか面倒だな……」と萎縮しそうですが、「どんなことを証明したいか」が明確なら、Excelのツールを使えば超簡単。タダで、しかも、ランチの時間内に完了します。
前回(統計的に「王様の耳はロバの耳」と言うために)では、裏付け手法の「平均値の差の検定」の理論部分を紹介しました。今回は、お金も時間もかけず、簡単に統計分析するやり方を実際に1ステップずつ紹介します。
1.まずはツールの準備
膨大なデータを人力で統計解析するのは、500人に電話でアンケート調査するほど面倒で、間違いも増えます。なにがなんでも、PC上のツールを使いましょう。筆者が学生のころ(注1)は統計計算を電卓をたたいて実施していました。今は、Excelに組み込まれた統計分析ツールを利用すればよいのです。電卓を使った手計算での統計分析が「自転車による移動」としたら、Excelのツールでの計算は「ボーイング767による世界旅行」ほどで、大きな進歩を実感します。
通常必要な10種類程度の統計的分析法は、Excelで網羅しています。これさえあれば、後は歯ブラシ1本をポケットに入れれば、日本全国統計分析縦断ツアーに行けます。今回は、Excelの分析ツール(注2)を使って統計分析をしてみましょう。この分析ツールでは足りない超上級者は、「R」(注3)の統計ツールを使ってください。
Excel 2007では、「Excelオプション」→「アドイン」内の「データ分析」の項目にチェックマークを付け、アドインを有効にします。アドインが有効になると、画面上部の「データ」内に「データ分析」という部分が表示されます。
今回は「データ分析」内の「一対の標本による平均の検定」を使用します。この分析手法はt検定と呼び、あらゆる分野のデータ分析で使います。詳細は割愛しますが、大枠の考え方は前回のコラムの内容と同じです。
次に、データを整理します。「一対の標本による平均の検定」には、「対応有りのデータ」が必要です(「対応有り」の詳細は、前回のコラムを参照)。準備が整ったら、分析を開始します。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 統計の食わず嫌いを直そう(その7)、「鎌倉時代の平均ワイン消費量」と「平均値の検定」
「効果がある」と言うためには比較が必要です。新旧開発プロセスの生産性や品質の平均値を比べるためには、「平均値の差の検定」が必要となります。 - 食わず嫌いを直そう、朝顔の観察日記とデータ収集(その6)
難しそうな「統計」ですが、データの分析以上に重要なのが「収集」です。今回は、統計分析の前段階に相当する「データを集める」という部分に焦点を当てて解説します。 - 食わず嫌いを直そう、「平均値」だけが平均じゃない!(その5)
データ解析の王様ともいえる「平均値」ですが、それが本当に母集団の性質を表現しているかは確認すべき事項です。母集団によっては「最頻値」や「中央値」の採用を考慮すべきです。 - 食わず嫌いを直そう、統計計算の王様「平均値」の落とし穴(その4)
思わず身構えてしまう「統計」ですが、手をつけてしまえば何とかなるものです。今回はデータ解析手法の“王様”である「平均」について、解説します。 - 食わず嫌いを直そう、小学生の知識で統計データを可視化する(その3)
「統計」と聞くと頭が痛くなる人も多いかと思いますが、「今持っている知識でも何とかなる」ものです。その第一歩として、簡単なデータの可視化手法について紹介します。