RDBとNoSQLのおいしいとこ取り!? 東芝のIoT向けデータベース「GridDB」とは製造業IoT(2/3 ページ)

» 2021年10月21日 07時30分 公開
[朴尚洙MONOist]

「GridDB」の4つの特徴

 先述した通り、東芝のGridDBはNoSQLのDBMSである。もともと独自のDBMSを持っていなかった東芝がGridDBの開発に乗り出したのは、同社の主力事業である社会インフラシステムを維持・管理していくために、システムの稼働状況を記録し活用するデータベースが必要になっていたという背景がある。望月氏は「2000年代に入ってシステム規模が大きくなり、RDBでは要件を満たせないことが明らかになっていた。その一方で、市場に出始めていたNoSQLは信頼性に不安があった。そこで、自らDBMSを開発することを決めた」と述べる。開発開始は2011年で、2013年に「GridStore」としてリリースされ、現在はGridDBという名称で展開されている。

 GridDBの特徴は4つある。1つ目は「時系列データ指向モデル」で、高頻度で大規模な時系列データを効率よくリアルタイム処理することに特化している。データモデルは、RDBで用いられているテーブル管理と、多くのNoSQLで用いられる「キー」による値やドキュメントの管理を組み合わせたキーコンテナ型モデルを採用。このキーコンテナ型モデルは、時系列データが多くを占めるIoTデータを管理するのに最適だという。

キーコンテナ型モデルIoTデータ管理に最適 「GridDB」が採用するキーコンテナ型モデルは(左)、IoTデータを管理するのに最適だ(右)[クリックで拡大] 出所:東芝

 2つ目の「ペタバイト級の高い処理能力」では、ペタバイト規模のデータを扱うために、CPUをフル活用できるイベント駆動エンジンや、メモリを最大限活用する時系列データ配置技術「TDPA(Time Series Data Placement Algorithm)」などの工夫を盛り込んだ。

イベント駆動エンジンTDPA 「GridDB」はCPUをフル活用できるイベント駆動エンジンや(左)、メモリを最大限活用する「TDPA」を採用している(右)[クリックで拡大] 出所:東芝

 3つ目は「高い信頼性と柔軟な拡張性」だ。まず、サーバ間でデータのコピーを保持しあう自動レプリケーションにより、万が一の障害時にも処理を継続できる。次に、NoSQLの特徴は拡張時にスケールアウトを利用できることだが、データ配置のバランスが悪いと特定のサーバに負荷が集中したり、データのコピーが不足すると可用性が低下したりするという問題がある。GridDBは、自律データ再配置技術(ADDA:Autonomous Data Distribution Algorithm)により、サーバ間でバランスよくかつ高速にデータを再配置することでこれらの問題に対応できる。

自動レプリケーション自律データ再配置技術 「GridDB」の「高い信頼性と柔軟な拡張性」を支える自動レプリケーション(左)と自律データ再配置技術(右)[クリックで拡大] 出所:東芝

 そして4つ目の「開発の俊敏性と使いやすさ」では、NoSQLとして独自のAPIを持つだけでなくSQLに対応するAPIも用意した。また、従来のDBMSでは難しいリアルタイム分析にも対応している。

デュアルインタフェースリアルタイム分析 「GridDB」はNoSQLとSQLのデュアルインタフェースを備えており(左)、リアルタイム分析も可能だ(右)[クリックで拡大] 出所:東芝

 GridDBと競合のNoSQLのDBMSを比較したベンチマーク試験も行っている。1秒当たりの平均書き込み件数(ops/sec)を示すスループットの比較では、Read50%+Write50%の条件で2.5倍、Read95%+Write5%の条件で8倍を記録した。長時間実行時で発生しやすい性能劣化でも、GridDBがほぼ性能劣化を起こさないことを確認している。また、センサー課金アプリケーションを用いたRDBとの比較では、低い負荷平均とメモリ使用量を維持しながら、取り込みおよび抽出/集約ワークロードの両方でGridDBが優れていたという。

「GridDB」と他のNoSQL製品とのベンチマーク比較 「GridDB」と他のNoSQL製品とのベンチマーク比較[クリックで拡大] 出所:東芝

Copyright © ITmedia, Inc. All Rights Reserved.