筆者所属企業のあるクライアント企業も、最適化ソルバーの解はインサイトとして捉えています。精度の高いモデルを作るよりも、モデルでの実験を繰り返しながら正しい方向に導いてもらうことを目指しています。実験は複数回繰り返しますが、それでも人間がランダムで検証するよりも効率的に良い結果を得られますし、その過程でモデルの精度も上がっていきます。
なお、高度な使い方として、モデルの精度を実験しながら上げていく「アクティブラーニング」という手法があります。これは、一番良い予測結果が得られる入力を求めるのではなく、予測モデルの精度を上げるために、実験を通してモデルの不確かな領域を発見するやり方です。
以下のグラフには、黒い●と赤い▲が分布していますが、この2つを識別する線を引くモデルを考える時、1回で最適値を求めるのではなく、2つが交わらないギリギリの領域(不確かな領域)を見つけて、決定境界をどこに引くかを考えます。この不確かな領域を集中的に実験することで、モデルの精度を上げていくのです(図5)。
さて、今回は製造業特有のデータ特性を意識しながら、アウトプットの価値を最大化するためのインプットを探るための最適化手法、結果の解釈の注意点について紹介しました。得られた結果を正解とするのではなく、あくまでヒントとして捉えて、より最適な配合や工程条件を探っていきましょう。
山本 祐也(やまもと ゆうや) DataRobot データサイエンティスト
DataRobot入社前は雪印メグミルクで約3年間、有限要素法と機械学習による計算設計を用いた乳製品の包装材料の開発に携わる。またその前は富士フイルムで約5年間、位相差フィルム、ミラーフィルム、光学的に透明な接着フィルム、透明導電フィルムなど、タッチパネルに関連する機能性フィルムの開発に従事。2010年に東京大学で物質科学分野の博士号を取得。Kaggleでのランキング上位入賞経験多数。
Copyright © ITmedia, Inc. All Rights Reserved.