エッジにも浸透する生成AI、組み込み機器に新たな価値をもたらすか:MONOist 2025年展望(3/3 ページ)
生成AIが登場して2年以上が経過しエッジへの浸透が始まっている。既にプロセッサやマイコンにおいて「エッジAI」はあって当たり前の機能になっているが、「エッジ生成AI」が視野に入りつつあるのだ。
AI処理性能が数十TOPSで消費電力が一桁Wの製品も登場
これらPC系プロセッサやJetsonは数十TOPS以上のAI処理性能を備えているものの、消費電力も大きい。Jetson Orin Nano Super開発者キットでも25Wで、PC系プロセッサは100Wを超える場合もある。もし“組み込み機器”をうたうのであれば、消費電力は一桁Wを目指したいところだ。
AI処理性能が数十TOPS、消費電力が一桁Wという製品も既に複数登場している。ルネサス エレクトロニクスは新世代のAIアクセラレータ「DRP-AI3」を搭載するMPU「RZ/V2H」を2024年2月に発売している。消費電力1W当たりのAI処理性能は10TOPS/Wであり、最大80TOPSでAI処理を行う場合の消費電力は8Wとなる。RZ/V2Hは、「Raspberry Pi」のフォームファクターを踏襲したシングルボードコンピュータ(SBC)となる「Kaki Pi(カキピー)」も発売されている。価格(税込み)は5万9800円で、これまでルネサスが展開してきた評価ボードより安価だ。オンラインサイトで容易に入手できることも含め、製品開発に取り組みやすい環境も整えている。
日本発のスタートアップであるエッジコーティックス(EdgeCortix)は、AI処理性能が60TOPSで、消費電力が8WのAIアクセラレータ「SAKURA-II」を2024年5月に発表した。Llama2やStable Diffusionなど数十億パラメーター規模のトランスフォーマーモデルの推論実行を効率よく行えることを目指して開発が進められた製品だ。
同じくスタートアップのIdeinは2024年12月、同社のエッジAIプラットフォーム「Actcast」を用いて生成AIモデルの一種である「CLIP」をエッジデバイスに実装し、クラウドと通信することなく簡単なプロンプトを設定するだけで任意の物体を分類できる画像解析アプリ「CLIP on Actcast」を発表した。アイシンと共同開発したAIカメラ「ai cast」上での実行する必要があるが、専用のソフトウェアやAIモデルを新たに構築することなく、AIカメラで任意の物体を撮影して簡単なプロンプトを設定するだけで、画像データを解析して物体を分類できるようになる。なお、ai castに組み込んでいるAIアクセラレータは、イスラエルのHailoが開発したAIチップ「Hailo-8」で、2.5Wの低消費電力ながら26TOPSのAI処理性能を備えている。
NXPジャパンは、無償で提供しているAI/機械学習開発ソフトウェア「eIQ AIソフトウェア」の最新アップデートで、エッジ向けに生成AIのカスタマイズ手法の一つである「RAG(検索拡張生成)」の作成を行える「eIQ GenAIフロー」という機能を追加した。独自NPUを採用するMPU「i.MX 9シリーズ」を搭載するエッジ機器において、LLMのRAGによる最適化が可能になる。使用するLLMはパラメーター数が10億台のLlama2-7BやLlama3-8B、Phi-3 Miniなどが想定されている。2025年初から利用が可能になる予定である。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- エッジであれエンドポイントであれ今こそ現場にAIを実装すべし
2023年に大きな注目を集めた生成AIは、膨大なパラメータ数とあいまってAIモデルをクラウド上で運用することが一般的だ。2024年は、AIモデルを現場側に実装するエッジAIやエンドポイントAIを活用するための技術が広く利用できるようになるタイミングになりそうだ。 - 「Jetson Orin Nano」のAI処理性能が70%向上、開発者キットの価格も半額に
NVIDIAは、組み込み機器向けAIモジュール「Jetson Orin Nano」の開発者キットについて、AI処理性能が従来比で70%増となる67TOPSに向上した「Jetson Orin Nano Super開発者キット」を発表した。価格も従来の499米ドルから半額となる249米ドルに値下げする。 - NVIDIAのファンCEOが断言「ロボットAI革命をリードするのは日本がふさわしい」
NVIDIAが東京都内で開催したユーザー向けイベント「NVIDIA AI Summit Japan」の基調講演にCEOのジェンスン・フアン氏が登壇。生成AIの登場によって「AIエージェント」と「フィジカルAI」という2つのAIアプリケーションが普遍的に利用されるようになり、特にフィジカルAIによるロボットの進化は日本がリードすべきと訴えた。 - NVIDIAの新アーキテクチャ「Blackwell」は生成AI特化、汎用人型ロボットにも適用
NVIDIAは「GTC 2024」において、新たなGPUアーキテクチャ「Blackwell」を発表。AI処理性能で前世代アーキテクチャ「Hopper」の5倍となる20PFLOPSを達成。生成AIの処理性能向上にも注力しており、Hopperと比べて学習で4倍、推論実行で30倍、消費電力当たりの処理性能で25倍となっている。 - 「JetsonよりエッジAIに最適」、ルネサスが最新AIアクセラレータ搭載MPUを発売
ルネサス エレクトロニクスは、新世代のAIアクセラレータ「DRP-AI3」を搭載し、消費電力1W当たりのAI処理性能で表される電力効率で従来比10倍となる10TOPS/Wを実現した「RZ-V2H」を発売する。 - “エッジ生成AI”に挑む日本発スタートアップ、60TOPSのAI処理性能を8Wで実現
生成AIへの注目が集まる中、その生成AIを現場側であるエッジデバイスで動かせるようにしたいというニーズも生まれつつある。この“エッジ生成AI”を可能にするAIアクセラレータとして最大AI処理性能60TOPS、消費電力8Wの「SAKURA-II」を発表したのが、日本発のスタートアップであるエッジコーティックスだ。 - RAGとの組み合わせでエッジ生成AIを可能に、NXPがAI開発ソフトに新機能
NXPジャパンが無償で提供しているAI/機械学習開発ソフトウェア「eIQ AIソフトウェア」の最新アップデートについて説明。時系列データを基にエッジ機器向けのAIモデルを構築する「eIQ Time Series Studio」と、生成AIのカスタマイズ手法の一つである「RAG」の作成を行える「eIQ GenAIフロー」という2つのエッジAI機能を新たに追加する。 - エッジ生成AIでAI開発費がゼロに、IdeinがOpenAIの「CLIP」活用アプリを発表
Ideinは、同社のエッジAIプラットフォーム「Actcast」を用いて生成AIモデルの一種である「CLIP」をエッジデバイスに実装し、クラウドと通信することなく簡単なプロンプトを設定するだけで任意の物体を分類できる画像解析アプリ「CLIP on Actcast」を発表した。