組み込みにおけるコンピュータビジョンを整理する:SYSTEM DESIGN JOURNAL(2/5 ページ)
画像認識(コンピュータビジョン、マシンビジョン)の需要は高まっており、その方法はさまざまです。画像による入力を有用なものとする実装方法について分類と整理を試みます。
特徴を見つける
ほとんど全てのビジョンシステムは、最初のステップで特徴を抽出します。当然ながら、システムが探す特徴の種類は達成しようとする事柄によって決まります。しかし、一般的なカテゴリも幾つかあります。
最も単純なものは、純粋に人工的な特徴、つまりビジョンシステムに役立てるためだけにオブジェクトに印刷したパターンです。その例には、バーコード、QRコード、アライメントパターンなどがあります。バーコードリーダーは、有効な2進数列になるパターンをスキャンするまでスキャンを続けます。QRパターンとアライメントパターンは、単純なアルゴリズムによってパターンの有無と方向を検出し、それからデータを抽出する点が異なります。
現実の世界では、QRコードやアライメントパターンが付いているものは多くありませんので、抽出するには、受け取ったシーンに存在する目立った特徴を見つける必要があります。このための技法のほとんどは、隣接ピクセル間の密度や色の変化率計算を利用します。変化率が最も大きいピクセルの場所は、そこが特徴であることを強く示します。文字認識装置は、このようにして手書きのページをストローク、位置、方向のリストに分解できます。さらに一般的な特徴抽出装置は、写真のシーンをエッジとコーナーからなる一種の線画、または多くの特徴的な点に分解できます。
主に顔認識に使用される、1つの興味深い特別なケースがあります。基本的に明るい長方形と暗い長方形が交互に現れるハール的な特徴は、特徴的なエッジやコーナーが不明瞭で不安定である、顔のようなイメージの、有用な抽象化になることがあります。例えば、顔には、両頬にまたがる明るい色の細長い長方形の水平領域と、ちょうどその上の両目にかかる同じようなサイズの暗い長方形があります(図.2)。
ルールベースのアルゴリズムは、それぞれの長方形の中でピクセル合計値を計算し、2つの合計の間の差を最大化することによって、顔の極めてソフトなイメージからでもこの長方形を抽出できます。そのような長方形の多くのセットを顔のさまざまな部分に適用すると、与えられた1つの顔では比較的安定した指標(長方形の場所、形状、ピクセル合計に基づく)が得られ、人間の判断で異なるとされるような顔との間では、異なる指標が得られます。
特徴抽出機能が行うことは、イメージにある特徴のリストをアルゴリズムに関係なく作成することです。多くの場合、リストにはそれぞれの特徴に関する属性が付加されます。このリストは、パターン認識用パイプラインのさらに深くに送り込まれます。
Copyright © ITmedia, Inc. All Rights Reserved.