ついに始まった外観検査と生成AIの融合――画像センシング展2024レポート組み込みイベントレポート(3/4 ページ)

» 2024年07月10日 07時00分 公開
[関行宏MONOist]

マルチモーダルLLMと画像認識の組み合わせ/外観検査AIの前処理を効率化

 続いて、AIおよび生成AI関連ソリューションを出展した4社を取り上げる。

 初出展のモルフォAIソリューションズは、カメラから取得した映像を言語化するマルチモーダルLLM(大規模言語モデル)に画像認識を組み合わせたソリューション「Duranta×LLM」を出展した。ChatGPTの映像版ともいえるようなサービスで、カメラ映像をLLMによって処理し、プロンプトからの設定や質問に応じて、映っている状況や異常をテキストで返すものである。

 例えば、店舗の監視カメラに対して、プロンプトから「どんな異常が映っていましたか」という問いとともに、「不審者」「けんか」「犯罪行為」「火事」「事故」などのキーワードを与えておく。いずれかのキーワードに該当する場面が検知されたときに、映像の内容を言語化した上でアラートが発報される。

 不法侵入や、建設現場での事故/転倒、介護現場や病室での転倒/ベッド落下、駅プラットホームから線路への落下、繁華街でのけんかなどの検知に利用できると訴求する。学習済みモデルを搭載しているため、追加の映像収集や学習は不要とのことであった。

 この他にも同社では、アナログメーターを対象にした遠隔点検および読み取り自動化ソリューション「DURANTA」や、介護現場や病床の見守りを行う「みまもりAI」などのソリューションを提供している。

画像センシング展に初出展したモルフォAIソリューションズ。写真内の右側にあるディスプレイを中心に展示したのが「Duranta×LLM」のデモシステムである[クリックで拡大]
「Duranta×LLM」のデモ画面 「Duranta×LLM」のデモ画面。プロンプトから「どんな異常が映っていましたか」という問いとともに、「不審者」や「犯罪行為」などのキーワードを与えておく。いずれかのキーワードに該当する場面が検知されたときに、映像の内容を言語化したアラートが発報される[クリックで拡大]

 こちらも初出展のアナモルフォシス・ネットワークスは京大発のベンチャー企業で、設立は2018年である。外観検査AIソリューション、棚卸し効率化AIソリューションおよび物体検知AIソリューションの3つが主な事業である。「誰もが使えるAIを実現する」ことをミッションに掲げている。

 今回の画像センシング展には、外観検査AIソリューションの一部である「NuLMiL(ヌルミル)」を出展した。

 従来、カメラ画像から不良箇所を見つける場合、高コントラスト化やエッジ強調などの前処理が必要だった。NuLMiLは、前処理の効率化を実現するソリューションで、AIモデルによる判定結果を複数提示し、その中から最も分かりやすい画像を選び、タッチペンで不良箇所にマーキングする(色塗りする)だけで、不良画像のアノテーションと学習が完了する仕組みである。

 既にカップ麺や冷凍食品の異物検知、エンジン部品の欠陥検知、インフラ構造物のヒビ検知などに導入されているという。金属部品のような反射の多い対象物でも適用できるという。

「NuLMiL」の概要 「NuLMiL」の概要。写し出された不良箇所にお絵かきソフトの要領で色を塗るだけで学習が完了する(中央左側)。不良画像と良画像のハイブリッド学習を採用している(同社のパンフレットから)[クリックで拡大]
金属部品のキズを検知する様子 金属部品の外観画像に対して、キズ(もしくはサビ)を検知して赤枠で表示している例[クリックで拡大]

Copyright © ITmedia, Inc. All Rights Reserved.