まだExcel職人に任せるの? 製造業IoTのハードルを下げるデータ準備の在り方とは製造業IoT

IoTやAIなどにより製造業でも現場でのデータ活用が本格化しています。しかし、「価値を生み出すデータ活用」にはいくつか超えないといけないステップがあり、活用に行き着く前につまずくケースも多く存在します。こうしたデータ活用のハードルを低減するにはどうしたらよいのでしょうか。データ活用の専門家に話を伺いました。

» 2018年05月29日 10時00分 公開
[PR/MONOist]
PR

 AI(人工知能)やIoT(モノのインターネット)、センサーを活用したサービスの普及によって、社会が急速な勢いでデジタル化しています。「モノ」のデータはセンサー技術やIoTの進展で増え続け、「ヒト」のデータはスマートフォンや音声認識技術、ウェアラブルデバイスによって増加を加速することでしょう。

 製造業においても、新製品の開発や品質の向上、顧客体験の向上、購買や調達のコスト削減などの多様なテーマにおいて、増えるデータとどう向き合い、活用するのかが大きな関心事項になっています。データを活用するにはまず「活用すべきデータ」を準備することが大前提となります。

 ところが今、「活用するためのデータの準備が追い付かない」という現象が頻発しています。皆さんの会社でも「分析や予測に使いたいデータがあるのに、使える状態にするまでに膨大な時間がかかる」といった問題が発生しているのではないでしょうか。

製造業は特にExcelが好き

 製造業および製造現場などでも、ユーザーが自分でデータ分析を行う環境は定着しているといえます。半導体などの精密機器の製造現場では高度な統計解析が必須となっていますし、製造現場ではもともと「改善活動」の一環として「PDCAサイクル」を進める文化が広がっており、そのためのデータ取得は基本とされてきたからです。

 このようなPDCAを回す中で、正しい分析結果を導くためには良質なデータが不可欠であると強く感じられた経験をお持ちの人も多いかもしれません。まさに、データを活用、分析するために避けて通れない重要なステップが、事前のデータ準備であるといえるのです。

 以下はアシストが2017年11月に実施したデータ利活用に関するWebアンケートの結果です。300人を超える回答の中から、今回は製造業のご回答者に絞った結果を紹介します。

photo データの収集、加工を行う手段(クリックで拡大)出典:アシスト

 このグラフを見ると製造業においてはデータの収集や加工にExcelを使うケースが圧倒的に多いことが分かります。また、SQLやAccessなども含めると、手作業によるデータ収集や加工が大部分を占めています。次に、データそのものに関する課題について見てみましょう。

photo データ活用における課題(クリックで拡大)出典:アシスト

 データの散在や、整形、名寄せなどデータの質に関する課題、データの種類や量に関する課題が浮き彫りになっています。

 これらの調査結果から見ても、今データ活用に求められるのは「多種多様かつ大量のデータを欠落のない、クリーンで、精査されたかたちに加工編集すること」が求められていることが分かります。また、具体的なユーザー像をイメージすると「Excelを自由自在に使いこなせる達人レベル」から「Excelを日常業務で使っているものの機能をフル活用するスキルを持っておらずデータ加工に手を焼いている方々」と定義することができそうです。

データ分析の8割を占めるのが事前のデータ準備

 企業内において、ETLツールやSQL言語などを駆使してデータを抽出・加工するスキルを持つのはIT部門です。しかしながら、ビジネス要件や業務データそのものを理解しているのはビジネス部門となります。そこで従来は、IT部門は要件をヒアリングした上でデータを準備し、ビジネス部門にデータを提供してきました。一方でビジネス部門は、欲しいデータのかたちはイメージできるものの、ITの専門家ではありませんので、ETLツールやSQL言語は扱えません。

 そうなってくると、ビジネス部門のデータ加工の切り札は、やはりExcelとなります。フィルターやピボットテーブルで欠損値や異常値を特定したり、VLOOKUPでデータセットを結合したり、複雑な関数やマクロの記述を手作業で行うのは、定常化した当たり前の業務になっています。

 しかし、手作業でのデータ加工には膨大な時間がかかりますし、データを準備できた頃には、本来の目的である分析の時間はあまり残っていないのではないでしょうか。ある調査によれば、「データ分析者は80%以上の時間をデータ準備に費やしている」という報告がなされており、データ加工やデータ準備の生産性向上が新たな課題として認識されはじめています。Excel職人の個人技だけに頼っていては難しい時代に入ってきているといえるのです。

photo データ準備の重要性(クリックで拡大)出典:アシスト

課題解決のキーは「データプレパレーション」

 このような課題を解決する方法として、「データプレパレーション」という新しい手法が注目されています。「データプレパレーション」は直訳すると「データの準備」ですが、もう少しかみ砕いて表現すると、以下のように4つの「C」で表すことができます。散在する大量かつ多様なデータを、ビジネス部門のユーザー自らが、これらの4つのCを満たした上で、素早く消費可能な情報に変えることが求められているのです。

  1. Complete:欠落がなく完全で
  2. Clean:揺れがなくクリーンで
  3. Contextual:ビジネス上の意味を持った
  4. Consumable:消費可能な形

Excelユーザーがデータを料理する3つのポイント

 しかし、現実的に今Excelを使用して改善活動を進めている製造業が「データプレパレーション」の4つのCを満たさないといけないといわれても、どうしてよいのか戸惑うと思います。

 そこで、Excelを使って日々データと格闘しているビジネス部門のユーザーが、データ準備の負担を軽減するために、新たにデータプレパレーションツールを導入する際に考慮すべき3つのポイントについて紹介します。

1. コーディングスキルがいらないこと

 Excelユーザーが求めるのは、マクロやコードを記述することなく、直観的な操作で簡単にデータ加工できることです。さらには、いくつもの機能を使うためだけに複数の画面を行き来するのではなく、Excelシートを扱うかのように一画面だけで操作できれば理想的です。その使い勝手を反映できるツールを採用するべきです。

2. 全てのデータを高速に処理できる

 Excelで開くのを諦めてしまうような大きなサイズのデータであっても、必要な全てのデータを高速に、かつ、リアルタイムに加工できることが重要です。データのサンプリング処理や、バッチ処理の開発などは、ビジネス部門のExcelユーザーに最適な手法とはいえないでしょう。

3. セルフサービスとガバナンスを両立

 たとえ簡単にデータを料理できたとしても、個人のスキルに依存するようなやり方では、組織としての持続的なデータ活用は実現できません。データ加工の工程やアウトプットデータはプラットフォーム上でセキュアに保存されるべきですし、必要に応じて、誰がいつ、どんな操作でデータを作ったのかがトレースできる監査性も重要です。データ加工をブラックボックス化させないことは、組織としてデータの信頼性を担保することにもつながります。

事例に見る「データプレパレーション」の効果

 では、製造業における実際の事例を通じて、「データプレパレーション」の効用を紹介しましょう。

 ある大手製造業の研究開発部門では、センサーデータを元にした予測モデルの構築のために、AI(機械学習)を活用しようとしていました。ところが、機械学習にデータを投入すれば、わずか10分で予測モデルが完成するにもかかわらず、投入する教師データの準備には約80時間もの外部委託工数が発生することが分かり、プロジェクト推進のボトルネックになっていました。

 そこで、「データプレパレーション」ツールのPaxata(パクサタ)で教師データの加工や準備を試したところ、これまでの8分の1の時間でデータ加工を行えたというのです。さらに、外部委託することなく研究開発部門のユーザー自らが、Excelライクなインタフェースを使ってセルフサービスで対応できることが分かりました。短時間、かつビジネスの現場で分析に必要なデータが準備できるため、分析業務の飛躍的な生産性向上につなげられたといいます。

 また、別の大手製造業では、イベント来場者から回収したアンケートのデータ加工に苦労していました。アンケートは、来場者が自社製品や他社製品に対して抱く「ルック&フィール」の情報をきめ細かく集めるために、デジタル化しやすい選択方式ではなく、あえて紙に手書きで記述したものをデータ化しているそうです。そのため、製品名や製品種別、メーカー名などに表記のゆらぎが多く発生することから、Excelでのデータの加工や集計に時間がかかり、製品デザインのチームや関連部署へのフィードバックが遅れがちでした。

 そこでPaxataで製品名の名寄せや感想のカテゴリー分け、表記の統一などのデータクレンジングを試したところ、アンケートデータのゆらぎを即座に解消し、顧客の声をスピーディーに活用できることが分かりました。

 データドリブン、つまりデータ主導で業務を進める時代になりつつありますが、PaxataのようなツールをIT部門だけではなく、ビジネス部門が自ら活用することで、これまで手付かずだったデータ活用が一気に進み、ビジネス上の課題をスピーディーに解決する事例がどんどん生まれてくるといえます。

photo Paxataでのデータ準備の一例。数百万件のデータの加工を行っている(クリックで拡大)出典:アシスト

データの所在はもっとバラバラになっていく

 工場内のセンサーやIoTデータ、また、ERPやMESのような社内システムなど製造業ではさまざまなシステムが存在するため、データを横串で見て分析するためには相当な労力が必要になります。さらには、デジタルマーケティング、人事、会計といった主要な業務アプリーケーションはクラウドで利用されることも増えており、データの所在はさらに分散し、バラバラになっていきます。

 これら全てのデータをIT部門が従来の手法で統合し、管理することはコスト的にも技術的にも難しくなってくるかもしれません。というのも、データが複雑になればなるほど、ユーザーからの要求も多様化するため、IT部門が得意とする標準化の領域からはますます外れていくからです。

 データを必要とするユーザーが、自分で素早くデータを準備できるようになると、企業全体のデータ活用は大きく前進します。労働力不足がますます深刻化しいくこれからの時代、Excelユーザー自らがデータ活用を実践することで、業務の生産性は飛躍的に高められるはずです。この機会に、今まで培ったExcelでのデータ分析力をさらに向上させるためにも、データ準備に焦点を当てたIT活用に注目してみてはいかがでしょうか。

筆者紹介

photo

花井正樹(はない まさき)

株式会社アシスト 情報基盤技術統括部 部長(Qlik Luminary)

1996年、アシスト入社。BI/DWHのフィールド・サポート業務を経験後、BI製品の品質管理業務に従事。SFAコンサルタントとして活動した後、「Qlik」ビジネスの立ち上げに参画。米Qlik社が指名するエバンジェリスト「Qlik Luminary」にパートナー企業からは日本人として唯一、5年連続で選出され、執筆・講演活動を通じてBIのトレンドや顧客成功事例を発信している。


Copyright © ITmedia, Inc. All Rights Reserved.


提供:株式会社アシスト
アイティメディア営業企画/制作:MONOist 編集部/掲載内容有効期限:2018年6月28日