特集
» 2008年08月12日 08時00分 公開

ニューヨーク・メッツで“ベンチ入り”した新顔とは?メジャー級のデータを管理せよ(2/2 ページ)

[Alan Radding,ITmedia]
前のページへ 1|2       

圧縮技術と迅速化…… メッツが選んだベンダーとは?

 メッツにとっての問題は、適切なベンダーあるいはベンダーの組み合わせを見つけることだった。担当チームが求めたものは、ローコストのディスクだけではなく、バックアップするデータの総量を小さくするデデュプリケーション技術や圧縮技術、そして複製プロセスをスピードアップするWAN最適化/高速化技術も含まれた。「しかし、あまり多くの技術を組み合わせると、ソリューションが複雑になり、別の問題が発生するリスクがある」と指摘するのは、ミネソタ州スティルウォーターのストレージIOグループ創立者で上級アナリストのグレッグ・シュルツ氏だ。

 VARのイープラス・テクノロジーと組んで、ミローヌ氏はベンダーを3社まで絞り込んだ。データ・ドメイン、EMC、そしてカンタムだ。最終的にメッツは2台のデータ・ドメイン製アプライアンスを採用した。7.5Tバイトのディスクストレージを搭載するDD565をシェイスタジアムに、またそれより小さい2.25TバイトのDD510をスターリング本社にインストールした。価格は9万5000ドルと1万9000ドルだった。

 いずれのユニットも圧縮およびデデュプリケーション機能を搭載しており、ミローヌ氏の計算によると、データボリュームは平均25倍の圧縮率で削減されるという。「場合によっては、80倍の圧縮率になることもある」と同氏は語る。

 データ・ドメインの製品は、データをディスクに格納する前に、不要なデータを削除するインライン・デデュプリケーション方式だ。この方式の場合、データはディスクに格納された瞬間から複製、管理が可能になる。ただし、この方式はプロセスのパフォーマンスに影響を与える(「デデュプリケーションのさまざまな方式」を参照)。

実装化はスムーズに運びバックアップは確実になった

 実装化はなんの障害もなくスムーズに運んだ。「実際、データ・ドメインのアプライアンスをバックアップサーバに接続するだけだった」とミローヌ氏。データ・ドメインのエンジニアの助けを借りて、ITスタッフがほとんどの導入作業を進めたが、1日かけて環境を準備し、数日かけて検証を行った後、すべて正常に動作した。

 それぞれのD2Dバックアップアプライアンスは、それぞれのロケーションでサーバをハンドリングする。加えて、スターリング本社のデータはシェイスタジアムで複製される。いまのところ、同社はテープを完全に放逐してはいない。「われわれはまだシェイスタジアムでテープを利用している」とミローヌ氏。そうした状況も、次の段階で終了する。シェイスタジアムのバックアップをスターリング本社か、新たにデータ・ドメインのアプライアンスを実装した第3の施設に複製する予定だ。その時点で、2カ所のデータセンターは第3のサイトに複製を置き、テープは不要になる。

 現在、データのバックアップは迅速化され、それらの信頼性はかってないほど高い。「私のスタッフも喜んでいる」とミローヌ氏。メッツが勝っても負けても、「以前よりぐっすり眠れるようになった」という。


デデュプリケーションのさまざまな方式

増大化するデータをコントロールする鍵となるのがデデュプリケーション技術だが、次のような形式がある。

アプリケーションサーバデュープ

データをバックアップサーバに送る前に、アプリケーションサーバ上で稼動するソフトでデデュプリケーションを実行する。バックアップのためにネットワーク上を流れるデータ量を減らすことができるが、アプリケーションサーバにプロセッシングのオーバーヘッドがかかる。

ブロックレベル

変更されたファイル内のブロックをチェックして、きめ細かなデデュプリケーションを行う。ファイル全体をセーブするのではなく、変更が加えられたブロックの部分だけをセーブする。

インライン

ディスクアレイへ送られる途中でデータをインターセプトし、データがディスクへ書き込まれる前にデデュプリケーションを実行する。格納されたデータは完全にデデュプリケートされ、直ちに複製その他の利用が可能になる。この方式はパフォーマンスに影響する場合がある。

ポストプロセッシング

データがアレイに格納された後でデデュプリケーションを実行する。パフォーマンスへの影響を避けることができるが、デデュプリケートされたデータを保持するために、バックアップシステムに追加的なストレージキャパシティが要求される。

シングルインスタンスストレージ

ファイルレベルでデデュプリケーションを実行する。ブロックレベルまで掘り下げず、ファイルで重複を判断するため、圧縮率の点では不利になる。例えば、ファイルの内容が変更されず、名前だけが変更された場合、ファイルレベルのデデュプリケーションでは重複することが認識できない。その場合、ファイルレベルのデデュプリケーションは新しいファイルと見なし、重複していると判断して削減することはない。

データ量をよりいっそう削減するために、デデュプリケーションとともに圧縮技術が用いられることが多い。ほとんどの場合、企業はまずデデュプリケーションを実行し、それから圧縮する。


前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

ITmedia エグゼクティブのご案内

「ITmedia エグゼクティブは、上場企業および上場相当企業の課長職以上を対象とした無料の会員制サービスを中心に、経営者やリーダー層向けにさまざまな情報を発信しています。
入会いただくとメールマガジンの購読、経営に役立つ旬なテーマで開催しているセミナー、勉強会にも参加いただけます。
ぜひこの機会にお申し込みください。
入会希望の方は必要事項を記入の上申請ください。審査の上登録させていただきます。
【入会条件】上場企業および上場相当企業の課長職以上

アドバイザリーボード

早稲田大学商学学術院教授

根来龍之

早稲田大学大学院国際情報通信研究科教授

小尾敏夫

株式会社CEAFOM 代表取締役社長

郡山史郎

株式会社プロシード 代表取締役

西野弘

明治学院大学 経済学部准教授

森田正隆