エッジコーティックスの技術基盤となっているのが、コンピュートエンジン間の接続をランタイムで再構成できるAIアクセラレータのアーキテクチャである「DNA（Dynamic Neural Accelerator）と、オープンソースで展開されているさまざまなAIフレームワークに対応してDNA向けのAIモデルをコンパイルする「MERA」だ。SAKURA-IとSAKURA-IIは、DNAとMERAというソフトウェア主導のAIプラットフォームに合わせて設計されたAIアクセラレータという位置付けになる。

エッジコーティックスの技術基盤。左下にあるAIアクセラレータアーキテクチャの「DNA」と、左上にあるコンパイラ／フレームワークの「MERA」が中核となる［クリックで拡大］出所：エッジコーティックス

　MERAについては、DNAだけでなく、Armやインテル、AMD、さらにはRISC-Vなどの主要なプロセッサアーキテクチャもサポートしており、CPUとAIアクセラレータを組み合わせるヘテロジニアスな処理を行うAIモデルのコンパイルも可能になっている。エッジコーティックスと同様にエッジAIアクセラレータ製品を展開するルネサスエレクトロニクスは、エッジコーティックスに出資するともに戦略的提携も行っており、ルネサスのAI製品を展開する上でMERAを活用している。

「MERA」の特徴［クリックで拡大］出所：エッジコーティックス

　SAKURA-IIの発表と併せてDNAとMERAも第2世代に進化している。実は、SAKURA-IとSAKURA-IIはどちらもTSMCの12nmプロセスで製造しているため、製造プロセスの微細化による性能向上や省電力の恩恵は受けていない。DNAが第2世代に進化し、これと併せて半導体設計の最適化をさらに進めたことによって、SAKURA-Iの1.5倍となる60TOPsの最大AI処理性能と標準8Wという消費電力を実現しているのだ。また、メモリ帯域幅は従来比で最大4倍の68GB/sに広がっており、生成AIモデルの処理にも十分対応可能になっている。

　また、第2世代となったMERAは、オープンソースのトランスフォーマーモデルを利用する場合に必要不可欠になりつつあるHuggingFaceとシームレスに連携できるようになった。「エッジ生成AIで用いられるパラメータ数が100億以下（10B）を中心に、数百のトランスフォーマーモデルを利用できる」（ヴェーリング氏）という。

「MERA」HuggingFaceとのシームレスな連携で数百のトランスフォーマーモデルを利用できる［クリックで拡大］出所：エッジコーティックス

　SAKURA-IIは、シングルチップでメモリ容量8GBもしくは16GBのM.2モジュールと、シングルチップでメモリ容量16GB／デュアルチップでメモリ容量32GBのPCIeカードのフォームファクターで、2024年後半に出荷される予定だ。予約価格は、シングルチップでメモリ容量8GBのM.2モジュールで249米ドル（約3万9000円）からとなっている。なお、ヴェーリング氏によれば「ニーズがあれば4チップ構成のPCIeカードも開発できる。この場合、AI処理性能は240TOPS、メモリ帯域幅は272GB/sに達する」と述べている。

「SAKURA-II」のM.2モジュールとPCIeカードの仕様［クリックで拡大］出所：エッジコーティックス

⇒その他の「組み込み開発インタビュー」の記事はこちら

エッジであれエンドポイントであれ今こそ現場にAIを実装すべし
2023年に大きな注目を集めた生成AIは、膨大なパラメータ数とあいまってAIモデルをクラウド上で運用することが一般的だ。2024年は、AIモデルを現場側に実装するエッジAIやエンドポイントAIを活用するための技術が広く利用できるようになるタイミングになりそうだ。
エッジAIがIoTデバイスのリアルタイムの意思決定を可能にする
インターネットに接続されるデバイスの数は2030年までに290億台に達すると予想されている。これらのエッジデバイス上でAI処理を行う「エッジAI」について、進化をけん引する4つの要素や、導入するメリットを解説する。
「マイコンでAI」に現実味、Armとともに可能性を追求へ
「第8回 AI・人工知能EXPO 【春】」の「小さく始めるAIパビリオン」に、Arm、STマイクロエレクトロニクス、ルネサスエレクトロニクス、AIスタートアップのエイシングが出展し、マイコンを用いたAI活用に関する展示を披露した。
NVIDIAの新アーキテクチャ「Blackwell」は生成AI特化、汎用人型ロボットにも適用
NVIDIAは「GTC 2024」において、新たなGPUアーキテクチャ「Blackwell」を発表。AI処理性能で前世代アーキテクチャ「Hopper」の5倍となる20PFLOPSを達成。生成AIの処理性能向上にも注力しており、Hopperと比べて学習で4倍、推論実行で30倍、消費電力当たりの処理性能で25倍となっている。
「JetsonよりエッジAIに最適」、ルネサスが最新AIアクセラレータ搭載MPUを発売
ルネサスエレクトロニクスは、新世代のAIアクセラレータ「DRP-AI3」を搭載し、消費電力1W当たりのAI処理性能で表される電力効率で従来比10倍となる10TOPS/Wを実現した「RZ-V2H」を発売する。
スバルが次世代「EyeSight」に採用、AMDの第2世代「Versal AI Edge」
AMDは、FPGA回路とCPUを集積したアダプティブSoCの新製品として、車載システムをはじめとする組み込み機器でのAI処理性能を大幅に高めた「Versal AI Edge Series Gen 2」を発表した。第1世代の「Versal AI Edge」と比較して、消費電力当たりのAI処理性能で3倍、CPU処理性能で10倍を実現している。