エッジコーティックスの技術基盤となっているのが、コンピュートエンジン間の接続をランタイムで再構成できるAIアクセラレータのアーキテクチャである「DNA(Dynamic Neural Accelerator)と、オープンソースで展開されているさまざまなAIフレームワークに対応してDNA向けのAIモデルをコンパイルする「MERA」だ。SAKURA-IとSAKURA-IIは、DNAとMERAというソフトウェア主導のAIプラットフォームに合わせて設計されたAIアクセラレータという位置付けになる。
MERAについては、DNAだけでなく、Armやインテル、AMD、さらにはRISC-Vなどの主要なプロセッサアーキテクチャもサポートしており、CPUとAIアクセラレータを組み合わせるヘテロジニアスな処理を行うAIモデルのコンパイルも可能になっている。エッジコーティックスと同様にエッジAIアクセラレータ製品を展開するルネサス エレクトロニクスは、エッジコーティックスに出資するともに戦略的提携も行っており、ルネサスのAI製品を展開する上でMERAを活用している。
SAKURA-IIの発表と併せてDNAとMERAも第2世代に進化している。実は、SAKURA-IとSAKURA-IIはどちらもTSMCの12nmプロセスで製造しているため、製造プロセスの微細化による性能向上や省電力の恩恵は受けていない。DNAが第2世代に進化し、これと併せて半導体設計の最適化をさらに進めたことによって、SAKURA-Iの1.5倍となる60TOPsの最大AI処理性能と標準8Wという消費電力を実現しているのだ。また、メモリ帯域幅は従来比で最大4倍の68GB/sに広がっており、生成AIモデルの処理にも十分対応可能になっている。
また、第2世代となったMERAは、オープンソースのトランスフォーマーモデルを利用する場合に必要不可欠になりつつあるHuggingFaceとシームレスに連携できるようになった。「エッジ生成AIで用いられるパラメータ数が100億以下(10B)を中心に、数百のトランスフォーマーモデルを利用できる」(ヴェーリング氏)という。
SAKURA-IIは、シングルチップでメモリ容量8GBもしくは16GBのM.2モジュールと、シングルチップでメモリ容量16GB/デュアルチップでメモリ容量32GBのPCIeカードのフォームファクターで、2024年後半に出荷される予定だ。予約価格は、シングルチップでメモリ容量8GBのM.2モジュールで249米ドル(約3万9000円)からとなっている。なお、ヴェーリング氏によれば「ニーズがあれば4チップ構成のPCIeカードも開発できる。この場合、AI処理性能は240TOPS、メモリ帯域幅は272GB/sに達する」と述べている。
Copyright © ITmedia, Inc. All Rights Reserved.