Ideinは、同社のエッジAIプラットフォーム「Actcast」を用いて生成AIモデルの一種である「CLIP」をエッジデバイスに実装し、クラウドと通信することなく簡単なプロンプトを設定するだけで任意の物体を分類できる画像解析アプリ「CLIP on Actcast」を発表した。
Ideinは2024年12月18日、東京都内で会見を開き、同社のエッジAI(人工知能)プラットフォーム「Actcast」を用いて生成AIモデルの一種である「CLIP」をエッジデバイスに実装し、クラウドと通信することなく簡単なプロンプトを設定するだけで任意の物体を分類できる画像解析アプリ「CLIP on Actcast」を発表した。「AI開発費ゼロ、AIの学習不要で、今すぐAIのPoC(概念実証)を始められる」(Idein 代表取締役/CEOの中村晃一氏)という。
CLIPは、ChatGPTで知られるOpenAIが2021年に発表した、画像とテキストの類似度を計測できるAIモデルである。画像とそのキャプション4億ペアのデータで学習されたCLIPは、追加の学習なしにさまざまな画像の分類に利用できる。
CLIP on Actcastは、このCLIPについて、ActcastをプラットフォームとしてAIモデルを含めたソフトウェアの運用を容易に行えるAIカメラ「ai cast」上で実行できるようにするアプリとなる。
CLIPをエッジデバイスであるai cast上で実行することにより、専用のソフトウェアやAIモデルを新たに構築することなく、AIカメラで任意の物体を撮影して簡単なプロンプトを設定するだけで、画像データを解析して物体を分類できるようになる。例えば、工場における特定の部品や、店舗における特定の商品などの数をカウントしたり、「作業者がヘルメットを着用しているか否か」「特定の場所にトラックが止まっているか否か」といった状態分類に基づくリアルタイムな異常検知に役立てたりできる。
CLIPは生成AIモデルの部品となるマルチモーダル基盤モデルだが、エッジデバイス上でスムーズに推論実行するにはそれなりのAI処理性能が必要になる。CLIP on Actcastのエッジデバイスとして用いているai castは、小型ボードコンピュータの「Raspberry Pi」にイスラエルのHailoが開発したAIチップ「Hailo-8」を組み合わせており、2.5Wの低消費電力ながら26TOPS(1秒当たり26兆回の四則演算が可能)のAI処理性能を備える。このため、CLIP on Actcastを動作させても14fpsというAIカメラとして実用上問題ない処理速度を実現できている。
Copyright © ITmedia, Inc. All Rights Reserved.