自動車業界が取り組む要因分析、AutoMLによる自動化でさらなる加速へ自動車業界向けAI活用入門(後編)(2/3 ページ)

» 2022年07月21日 07時00分 公開

そもそも要因分析とは?

 要因分析は、収集したさまざまなデータから、関係があるといえる幾つかの要因の中から関係を定量的に分析する手法です。

 要因分析を実施することで、特に改善につながる特定の要因の影響度を定量的に計測できるので、次なる改善の施策を検討する際に大きな効果を発揮します。このため、要因分析は自動車業界だけではなく多くの領域で活用されています(表1)。

表1 表1 要因分析の適用分野とユースケース[クリックで拡大]

 では、要因分析の活用事例として、走行中の車両データから自動車部品の故障要因を特定するためのカイゼンの施策を実施する事例を考えてみます。

 部品の故障予測を行い、故障前にドライバーやディーラーにパーツ交換やメンテナンスを促すというサービスを提供する場合は、まず故障をなるべく早く、正確に予測することが重要視されます。その際は、故障予測を推定するためのAI(人工知能)モデルの精度をできる限り高めることが目的となります。この目的を実現するだけであれば、ある意味予測精度を高めるためにはどのような要因(特徴量)を使ってもいいことになります。

 一方で、自動車の部品がなぜ壊れたかを判断した上で、その故障要因を調べて、その結果に基づき改善内容を決定する場合は、要因分析を活用する必要があります。その場合は、「着目している事象と要因の間に因果関係があるか」「特定した要因が介入可能なものか」「それら要因が特定の事象に対してどの程度影響を持っているのか」という3つのことを見極めた上で、結果に基づき改善内容を決定する必要があります(図1)。

図1 図1 要因分析とは[クリックで拡大]

 まず、「着目している事象と要因の間に因果関係があるか」の見極めは極めて重要です。特に、着目している事象と一見関連があるように見えても、実は疑似相関(偽相関)である可能性があるからです。

 偽相関の有名な例として“ホームランバッターほど三振が多い”があります。では、バッターが三振を心掛ければ結果的にホームランが増えるか、というと決してそういうことはありません。このような偽相関は、モビリティ分野の要因分析データでも多々含まれております。

 例えば、白色の車両ほど事故率が低く、一方で青色の車両ほど事故率が高い、という事例については、確かに白色の車両の方が目立つので事故率が低い、といったような因果関係があるとも言われています。その一方で、白色と青色の車両では、ドライバーの年齢層が大きく異なるがため、実はそちらが影響しているのではないか、とも言われています。

 本稿では、偽相関を発見した上でそれら要因を除外するための手法については説明しません。しかし、要因分析を実施する際は、偽相関をドメイン知識などに基づき正確に除外することがとても重要です。なお、機械学習を用いた要因分析のコツについては、筆者と同じくDataRobotに所属する山本祐也が執筆した記事で取り上げているので、そちらも参考にしてください。

 また、「特定した要因が介入可能なものか」については、分析前に評価しておくことが大変重要です。

 例えば、走行中の車両のデータを分析した結果、部品の故障の最も重要な要因が「道路の舗装状態」だったとします。すなわち道路の舗装状態が悪い道を車両が走行したために部品が故障したという理由であっても、自動車メーカーがその道路を修復することはできません。一方で、これらの要因分析をする主体が地方自治体であった場合は、道路を修復することは可能です。このような事例からも分かる通り、要因分析を実施する主体が要因分析の結果をみて改善できるかどうかを事前に検討した上で分析対象となる要因を決定する必要があります。

 そして、「それら要因が特定の事象に対してどの程度影響を持っているのか」については、故障がどのような要因から発生しているのかを見極め、要因の重要性を評価します。それらを定量化する場合は、着目している事象と要因との相関を求めることによって評価します。機械学習やAutoMLを活用する場合は、機械学習モデルの変数重要度を活用し要因の影響度を定量化することで、どの要因が着目する事象に対して影響を与えているのかを分析することになります。

Copyright © ITmedia, Inc. All Rights Reserved.