2008年9月19日金曜日

データクラウド

以前、Executable Storageという記事を書いたが、その補足ないし続きになる。
CPU、ネットワーク、ストレージのうち、もっとも進歩の遅い部分はネットワークである。
これにはいくつかの原因がある。CPUやストレージは徐々に性能や容量をあげることができる。しかし、ネットワークは急激に上昇する。例えば、100 base -> 1000 base/1G base -> 10G baseといったぐあいに10倍ずつ増加する。加えてインフラであるため一気に置き換える必要がある。部分的な更新はほとんど意味がない。それゆえ、次世代技術が普及する(普及品になる)までは長い時間がかかる。
ストレージはCPUに対してネットワークの「こちら」にあるか、「あちら」にあるかで立場が違う。「こちら」にあればクライアントに内蔵され、「あちら」にあればサーバに内蔵されたオンラインストレージを意味する。
今後のトレンドとしてユーザはますますモバイルを好むようになる。PCがなくなるという意味ではなく、PCより携帯が身近になるという意味だ。現在が既にそうだ。しかし、今の携帯は機能的に未熟な製品が多いのでPCを駆逐するには至っていない。しかし、iPhoneやスマートフォンが普及するとPCの存在そのものが疑問視されるようになる。この傾向からクライアントに大容量のHDDを搭載する機会は減少するといえる。既にULCPCでさえSSDを使い、容量より省エネないし性能を重視している。
以上のことから大容量ストレージはサーバ側で使われると予想できる。ここで、ネットワークがボトルネックであることが重要な意味を持つ。CPUとストレージが分断されては十分な性能が発揮できない。そこで、ストレージをクライアントに移すより、CPUをサーバに移す方法が選択される。これがクラウドだ。
現在のクラウドはCPUの集合体というイメージの方が大きい。必ずしも十分なストレージがあるとは限らないからだ。したがって、クラウドの下層にストレージの集合体としてのデータクラウドが存在する必要がある。
データクラウドも一種のクラウドであるためプロセッサを内包する。しかし、処理より管理の比重が高い。この微妙な差は料金体系で区別するべきだろう。
データクラウドの流れは始まっているといってもよい。AmazonのAWSではS3とEC2は明確に区別されている。また、研究レベルでもフォルダ・プログラミングというものが提案されている。また、古くはチャネル・アーキテクチャなどもある。Lindaのevalも発想は似ている。
クラウドであえてデータを分離する必要はないという考えもあるかもしれない。しかし、計算を主力とするクラウドではSSDが普及するだろう。その場合、計算機の容量はそれほど多くない。一方、HDDを内蔵したノードでデータクラウドが実現される。

0 件のコメント: