データ・ストリーム管理システム (DSMS) はデータを基本的にはメモリ上で処理し,ディスクを使用しない. しかし,データがあとで使用されるばあいにはそれをディスクに格納するばあいもある. この機能を DSMS の蓄積機能とよぶことにする. ここでは蓄積機能について説明する.
継続的クエリが基本的には最近入力されたデータにだけを使用するのに対して,DSMS に対してアドホック・クエリとよばれる一時的なクエリも入力されうる. アドホック・クエリはそれが入力されて以降の一定範囲のストリーム・データに対して適用されるばあいもあるが,過去のデータを必要とするばあいもある. このようなクエリの入力が可能なばあいには,あらかじめ過去のデータを蓄積しておく必要がある.
DSMS の蓄積機能についての論文はあまりないが,Babcock ら [Bab 02] は過去のデータを参照するクエリ (Queries Referencing Past Data) との関係で,それにふれている. すなわち,通常,ストリームにふくまれるすべての情報を保存することはできないので,汎用の概要や集約を生成して保存するという案がしめされている. ただし,この案を実現しているわけではないし,それに関する文献を参照してもいない.
参考文献
- [Bab 02] Babcock, B., Babu, S., Datar, M., Motwani, R., and Widom, J., “Models and Issues in Data Stream Systems”, 21st ACM Symposium on Principles of Database Systems (PODS 2002), 2002.