先述した通り、東芝のGridDBはNoSQLのDBMSである。もともと独自のDBMSを持っていなかった東芝がGridDBの開発に乗り出したのは、同社の主力事業である社会インフラシステムを維持・管理していくために、システムの稼働状況を記録し活用するデータベースが必要になっていたという背景がある。望月氏は「2000年代に入ってシステム規模が大きくなり、RDBでは要件を満たせないことが明らかになっていた。その一方で、市場に出始めていたNoSQLは信頼性に不安があった。そこで、自らDBMSを開発することを決めた」と述べる。開発開始は2011年で、2013年に「GridStore」としてリリースされ、現在はGridDBという名称で展開されている。
GridDBの特徴は4つある。1つ目は「時系列データ指向モデル」で、高頻度で大規模な時系列データを効率よくリアルタイム処理することに特化している。データモデルは、RDBで用いられているテーブル管理と、多くのNoSQLで用いられる「キー」による値やドキュメントの管理を組み合わせたキーコンテナ型モデルを採用。このキーコンテナ型モデルは、時系列データが多くを占めるIoTデータを管理するのに最適だという。
2つ目の「ペタバイト級の高い処理能力」では、ペタバイト規模のデータを扱うために、CPUをフル活用できるイベント駆動エンジンや、メモリを最大限活用する時系列データ配置技術「TDPA(Time Series Data Placement Algorithm)」などの工夫を盛り込んだ。
3つ目は「高い信頼性と柔軟な拡張性」だ。まず、サーバ間でデータのコピーを保持しあう自動レプリケーションにより、万が一の障害時にも処理を継続できる。次に、NoSQLの特徴は拡張時にスケールアウトを利用できることだが、データ配置のバランスが悪いと特定のサーバに負荷が集中したり、データのコピーが不足すると可用性が低下したりするという問題がある。GridDBは、自律データ再配置技術(ADDA:Autonomous Data Distribution Algorithm)により、サーバ間でバランスよくかつ高速にデータを再配置することでこれらの問題に対応できる。
そして4つ目の「開発の俊敏性と使いやすさ」では、NoSQLとして独自のAPIを持つだけでなくSQLに対応するAPIも用意した。また、従来のDBMSでは難しいリアルタイム分析にも対応している。
GridDBと競合のNoSQLのDBMSを比較したベンチマーク試験も行っている。1秒当たりの平均書き込み件数(ops/sec)を示すスループットの比較では、Read50%+Write50%の条件で2.5倍、Read95%+Write5%の条件で8倍を記録した。長時間実行時で発生しやすい性能劣化でも、GridDBがほぼ性能劣化を起こさないことを確認している。また、センサー課金アプリケーションを用いたRDBとの比較では、低い負荷平均とメモリ使用量を維持しながら、取り込みおよび抽出/集約ワークロードの両方でGridDBが優れていたという。
Copyright © ITmedia, Inc. All Rights Reserved.