2012年1月28日土曜日

データの長期保管

クラウド時代にはデータはクラウドに集まる。いわゆるライフログではセンサーのデータもクラウドに収集される
ビッグデータではどのようなデータも無視できない。将来思わぬ活用法が見つかるかもしれない。捨てられたデータは復活できないので、捨てずに保管することが重要になる。
データを長期に渡って保管するには大容量のストレージが必要になる。しかし、大容量のストレージは既に存在する。コストに問題はあるが、利用は可能だ。
データの長期保管では、ただ単に保管すれば良い訳ではない。データはアプリケーションと対になる。データだけ保管してもアプリケーションがなければ読み書きできない。そこで、少なくともアプリケーションを含めて保管する必要がある。
アプリケーションはOSに依存する。OSも保管する必要がある。さらにOSはハードに依存するので、ハードの仮想マシンも保管しなければならない。
ソフトウェアは著作物なのでいつかはパブリックドメインになる。それまでライセンスを厳守する必要がある。
過去のデータを情用するには耐えずアプリケーションのバージョンアップに応じてデータを変換する必要がある。これには一つ一つ確認しながら変換する方法も考えられるが、手間を考えると現実的でない。クラウドなら徐々に一括して変換することもできる。ただし、ユーザーが確認していないので、変換結果が期待通りかどうかわからない。そこで、バージョン管理と併用することが望ましい。その結果、容量はさらに増える。過去のデータほど容量が必要になるので、対投資効果として問題が残る。
現在は、まだコストを気にする必要がある。過去のデータは比較的容量が小さいが、複数のバージョンを管理したりすれば、ちりも積もって無視できなくなる。やがて、それでも十分に無視できるほどストレージの技術が進歩するだろう。それからが本当のデータの永久保管が可能となる。

0 件のコメント: