メディア

工程別：

組み込み開発

製造マネジメント

産業別：

モビリティ

素材／化学

食品・薬品・衣料品

中小製造業

サステナ設計

エッジ逆襲

編集後記

MONOist > 組み込み開発 >

特集：IoTがもたらす製造業の革新～進化する製品、サービス、工場のかたち～

機械学習はどうやって使うのか――意外と地道な積み重ね：いまさら聞けない機械学習入門（後編）（2/4 ページ）

» 2018年05月22日 10時00分公開

[西啓（PTCジャパン株式会社），MONOist]

前のページへ 1|2|3|4 次のページへ

3．集めたデータの分析

　データを整理し機械学習ツールの形式に成形したところで、ようやくツールの出番となる。まずは集めたデータを分析し、ゴール変数に対してどの入力変数がどのくらい関係しているのかを見てみる。

　図2の例では、ThingWorx Analyticsが持つシグナル機能により、エスプレッソマシンのグラインダーの故障に、どの要因が関係してるかをランクが高い順に表示している。要因のトップは1日当たりの平均使用回数だ。これだけを見ると当たり前すぎて何の知見も得られないと思われるが、画面右側には故障率順に使用回数のヒストグラムが表示されており、350.5回を境に故障率がおよそ24％から60％に跳ね上がることが読み取れる。このように具体的な数値として要因を分析できるのがツールの便利なところである。

図2　エスプレッソマシンのグラインダーの故障要因（クリックで拡大）

　さらに複数の入力変数の組み合わせによりゴール変数の値が高く（もしくは低く）なるグループを探し出すのが、ThingWorx Analyticsのプロファイル機能だ。図3では、先のエスプレッソマシンのグラインダーの故障に一番関わるグループを示している。画面では1日の平均使用回数が350.5～483回のときにおよそ66％の故障率だが、グラインダーがサテライトタイプだと83％に上がると表示されている。使用回数とこのグラインダーのタイプに何か問題があると推測され、設計や顧客への利用ガイドの検討材料となるだろう。

図3　故障率との関係の強い組み合わせ（クリックで拡大）

　これらの分析から、入力変数を見直すこともできるだろう。特に、入力変数の数が多い場合は、ゴール変数と関係の弱い入力変数を、この後おこなう予測モデル作成対象から外すことで予測モデルの作成時間を短縮できる。

予測モデルを作る

前のページへ 1|2|3|4 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

Special ContentsPR

特別協賛PR

スポンサーからのお知らせPR

Special ContentsPR

Pickup ContentsPR

組み込み開発の記事ランキング

Special SitePR

コーナーリンク

ロボットフォーラム

エッジコンピューティングの逆襲

よく読まれている編集記者コラム

日本で水素活用を阻む壁、中国は再エネと水素の導入を加速

定年退職した理系シニア人材が核融合発電炉開発で活躍、なぜ？

中国の自動車メーカーとテスラに競争力があるのは「合理性が高い」から

≫ 編集後記一覧

あなたにおすすめの記事PR

RSSフィード

MONOistについて

会員メニュー

公式SNS

Facebook
X

ITmediaはアイティメディア株式会社の登録商標です。

メディア一覧 | 公式SNS | 広告案内 | お問い合わせ | プライバシーポリシー | RSS | 運営会社 | 採用情報 | 推奨環境