“エッジ生成AI”に挑む日本発スタートアップ、60TOPSのAI処理性能を8Wで実現:組み込み開発 インタビュー(2/2 ページ)
生成AIへの注目が集まる中、その生成AIを現場側であるエッジデバイスで動かせるようにしたいというニーズも生まれつつある。この“エッジ生成AI”を可能にするAIアクセラレータとして最大AI処理性能60TOPS、消費電力8Wの「SAKURA-II」を発表したのが、日本発のスタートアップであるエッジコーティックスだ。
ソフトウェア主導の技術基盤
エッジコーティックスの技術基盤となっているのが、コンピュートエンジン間の接続をランタイムで再構成できるAIアクセラレータのアーキテクチャである「DNA(Dynamic Neural Accelerator)と、オープンソースで展開されているさまざまなAIフレームワークに対応してDNA向けのAIモデルをコンパイルする「MERA」だ。SAKURA-IとSAKURA-IIは、DNAとMERAというソフトウェア主導のAIプラットフォームに合わせて設計されたAIアクセラレータという位置付けになる。
MERAについては、DNAだけでなく、Armやインテル、AMD、さらにはRISC-Vなどの主要なプロセッサアーキテクチャもサポートしており、CPUとAIアクセラレータを組み合わせるヘテロジニアスな処理を行うAIモデルのコンパイルも可能になっている。エッジコーティックスと同様にエッジAIアクセラレータ製品を展開するルネサス エレクトロニクスは、エッジコーティックスに出資するともに戦略的提携も行っており、ルネサスのAI製品を展開する上でMERAを活用している。
SAKURA-IIの発表と併せてDNAとMERAも第2世代に進化している。実は、SAKURA-IとSAKURA-IIはどちらもTSMCの12nmプロセスで製造しているため、製造プロセスの微細化による性能向上や省電力の恩恵は受けていない。DNAが第2世代に進化し、これと併せて半導体設計の最適化をさらに進めたことによって、SAKURA-Iの1.5倍となる60TOPsの最大AI処理性能と標準8Wという消費電力を実現しているのだ。また、メモリ帯域幅は従来比で最大4倍の68GB/sに広がっており、生成AIモデルの処理にも十分対応可能になっている。
また、第2世代となったMERAは、オープンソースのトランスフォーマーモデルを利用する場合に必要不可欠になりつつあるHuggingFaceとシームレスに連携できるようになった。「エッジ生成AIで用いられるパラメータ数が100億以下(10B)を中心に、数百のトランスフォーマーモデルを利用できる」(ヴェーリング氏)という。
SAKURA-IIは、シングルチップでメモリ容量8GBもしくは16GBのM.2モジュールと、シングルチップでメモリ容量16GB/デュアルチップでメモリ容量32GBのPCIeカードのフォームファクターで、2024年後半に出荷される予定だ。予約価格は、シングルチップでメモリ容量8GBのM.2モジュールで249米ドル(約3万9000円)からとなっている。なお、ヴェーリング氏によれば「ニーズがあれば4チップ構成のPCIeカードも開発できる。この場合、AI処理性能は240TOPS、メモリ帯域幅は272GB/sに達する」と述べている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- エッジであれエンドポイントであれ今こそ現場にAIを実装すべし
2023年に大きな注目を集めた生成AIは、膨大なパラメータ数とあいまってAIモデルをクラウド上で運用することが一般的だ。2024年は、AIモデルを現場側に実装するエッジAIやエンドポイントAIを活用するための技術が広く利用できるようになるタイミングになりそうだ。 - エッジAIがIoTデバイスのリアルタイムの意思決定を可能にする
インターネットに接続されるデバイスの数は2030年までに290億台に達すると予想されている。これらのエッジデバイス上でAI処理を行う「エッジAI」について、進化をけん引する4つの要素や、導入するメリットを解説する。 - 「マイコンでAI」に現実味、Armとともに可能性を追求へ
「第8回 AI・人工知能EXPO 【春】」の「小さく始めるAIパビリオン」に、Arm、STマイクロエレクトロニクス、ルネサス エレクトロニクス、AIスタートアップのエイシングが出展し、マイコンを用いたAI活用に関する展示を披露した。 - NVIDIAの新アーキテクチャ「Blackwell」は生成AI特化、汎用人型ロボットにも適用
NVIDIAは「GTC 2024」において、新たなGPUアーキテクチャ「Blackwell」を発表。AI処理性能で前世代アーキテクチャ「Hopper」の5倍となる20PFLOPSを達成。生成AIの処理性能向上にも注力しており、Hopperと比べて学習で4倍、推論実行で30倍、消費電力当たりの処理性能で25倍となっている。 - 「JetsonよりエッジAIに最適」、ルネサスが最新AIアクセラレータ搭載MPUを発売
ルネサス エレクトロニクスは、新世代のAIアクセラレータ「DRP-AI3」を搭載し、消費電力1W当たりのAI処理性能で表される電力効率で従来比10倍となる10TOPS/Wを実現した「RZ-V2H」を発売する。 - スバルが次世代「EyeSight」に採用、AMDの第2世代「Versal AI Edge」
AMDは、FPGA回路とCPUを集積したアダプティブSoCの新製品として、車載システムをはじめとする組み込み機器でのAI処理性能を大幅に高めた「Versal AI Edge Series Gen 2」を発表した。第1世代の「Versal AI Edge」と比較して、消費電力当たりのAI処理性能で3倍、CPU処理性能で10倍を実現している。