設備監視、センサーネットワーク監視などを大規模に、リアルタイムに実施するのに適した製品が登場。製造業界のデータ管理も「ビッグデータ」対応が急がれる
日本IBMは2011年5月23日、「InfoSphere BigInsights V1.1」「InfoSphere Stream V2.0」を発表した。
InfoSphere BigInsights V1.1は、大規模データを並列・分散処理するのに適した製品。Googleなどが開発した大規模分散処理システムのオープンソース版である「Apache Hadoop」には、企業が持つ情報を管理するには不安視される要素が幾つかあった。これらをカバーし、実務で利用可能な信頼性と可用性を持たせる製品となる。
例えば、Hadoopは並列分散処理のための仕組みだが、タイミングなどの幾つかの要因が重なるとデータの欠落が発生する可能性があり、アーキテクチャ上はそれを担保する機構を持たない。また、セキュリティ面でも独自に対策を盛り込む必要があり、実装の工数が多く掛かる。
システム開発コストの面から考えるとHadoopをそのまま使う場合は独自のデータリクエスト方法(MapReduce)が必要なため、開発そのもののハードルが高く、メンテナンス性も含めて、業務分野での利用は難しいとされていた。
今回の製品は、上述のHadoopが持つ弱点を補う機能・ツール・言語環境を提供するものだ。独自のWebベースの管理コンソールツールや、クエリ言語「Jaql」の提供、データアクセスのセキュリティ対策としてLDAPを使った認証機能など、エンタープライズ用途のシステム要件に対応する機能を盛り込んでいるとしている。
同社ではこのBigInsightsを同社が持つCognosやSPSSなどの分析ソリューション、Netezzaなどの主要ベンダーのデータウェアハウスとの連携を視野に入れた「Big Dataアーキテクチャ構想」のコア機能「Big Data Entereprise Engines」の中心に位置付けている。
一方の「InfoSphere Stream V2.0」は、ストリームデータを高速に処理するためのミドルウェアだ。前述のBigInsightsが大量データの分析に適しているのに対して、こちらは、大量の情報を高速かつリアルタイムに処理するのに適している。2年ほど前から提供されている製品だが、今回のリリースでは処理言語の構造を見直しており、従来製品と比べて約3.5倍のパフォーマンスを得られるようになっているという(1000万件/秒程度)。このほか、データマイニング用のマークアップ言語であるPMMLを生成するためのツールキットも新たに提供される。
ストリームデータの高速分析は、例えば5分おきに端末から送られてくる実績データをその場で分析するといった用途に適している。製造装置に付けられた各種センサー(温度、湿度、電圧など)の個別の情報はその場で処理し、BigInsightsなどが持つ過去の蓄積データと比較検討して分析する、といった利用方法も考えられる。
従来、商品や取引情報の分析を高速に行う必要のある金融系の企業からの引き合いが多かったというが、最近では装置や機器のリアルタイム処理に関してニーズが高まりつつある製造業界でも引き合いがあるという。具体名は明かさなかったが、ある半導体メーカーでは装置の監視などで導入を検討し、実証実験を進めるところだという。
構造化データだけでなく、画像(検査画像など)や動画(製造ラインの人員の導線など)といった、生産現場の情報管理や、あるいは、文字や数値以外の顧客からのフィードバック情報、Web上の「口コミ」情報の分析のようなマーケティングリサーチにも活用できるとしている。
InfoSphere BigInsights Enterprise Edition V1.1は従量課金制で1テラバイト当たり285万円からとなっており、2011年5月27日から出荷を開始する。InfoSphere Streams V2.0は1コア当たり464万円からで、2011年5月24日から出荷を開始する。
InfoSphere BigInsightsにはEnterprise Editionのほかに、同社独自の支援ツールなどを省いた無償のBasic Editionが用意されている。
Copyright © ITmedia, Inc. All Rights Reserved.