EMCは、企業のデータをバックアップするソリューションを多数用意しており、お客様のあらゆるニーズに対応しています。また、データ重複除外(※重複排除)は次世代のバックアップ・ソリューションにおいて重要な技術と認識しており、柔軟に融合することで、今後の企業のデータバックアップの課題に対応できるように開発を続けています。
ここでは、毎週1回ずつ計4回にわたり、データ重複除外バックアップのソリューションである「EMC Avamar(以下Avamar)」に焦点を絞って、技術面、ソリューション面、実運用面などのあらゆる角度から説明します。
第1回である今回は、Avamarによるデータ重複除外の仕組みについて解説していきます。
次回以降では「Avamarのシステム概要」、「Avamarの導入が適している環境」、「Avamarの信頼性」についての解説を予定しています。
なお、データ重複除外の基本的な考え方や、それぞれの特徴などにつきましては、別途「データ重複除外(重複排除)テクノロジー」の記事に取り上げていますので、予め目を通していただくことをお勧めします。
※ 「重複除外」は「重複排除」と呼ばれていることもありますが、EMCでは重複除外という用語で統一しております。両者は基本的に同じカテゴリーの技術ですが、細かいテクノロジーやアプローチなど、製品ごとにそれぞれ特徴があります。
EMCは2006年11月にAvamar Technologies, Inc.を買収し、のち2007年6月に日本国内でAvamarの販売を開始しました。Avamarは、『Storage』誌のベスト・バックアップ/リカバリ・ソフトウェア部門で、本年度の「プロダクト・オブ・ザ・イヤー」を受賞するなど、重複除外技術バックアップとして以前より定評がありました。Avamarの技術は、従来のデータ保護の方法を根本的に変え、これまで導入が困難であった環境にも対応するソリューションです。
Avamarは、特許取得済みのデータ重複除外技術を使用しています。その技術を用いてAvamarはバックアップ環境全体を通してユニークなデータを「一回」のみバックアップします。Avamarはデータ・ソースの冗長なセグメントを識別することで、ネットワーク帯域幅と保存データの量を縮小します。この技術で、日々ネットワークに送信されるバックアップ・データを平均300分の1にまで縮小することができます。
Avamarのバックアップ/リカバリ・ソフトウェアと従来のバックアップ手法には大きな違いがあります。もっとも特徴的なことは、ソース(クライアント)側でデータ重複除外を実行するため、重複するデータがネットワークを介して無駄に送信され保存されるのを回避できることです。データ量の大幅な増加を防ぎ、バックアップに要する時間が短縮されるため、ストレージ、データ・センターの空調など、バックアップにかかるインフラストラクチャのTCOも大幅に削減されます。
市場にはデータ重複除外技術を搭載した製品が数多く販売されていますが、その大多数は、すべてのデータをバックアップ・ストレージに送信してから、重複除外を実行しています。つまり、遠隔地や地方にある重複した大量のデータをネットワークに送信します。それとは対照的に、Avamarは、データをネットワーク上に送信する前にソース(クライアント)側でデータの重複除外を実行し、予めデータを最小限に縮小します。
それでは、ソース側でデータ重複除外を行う有利点を詳しく説明します。
従来からある、ターゲット・レベルまたはデバイス・レベルでのデータ縮小の例としては、一般的なテープへの圧縮があります。この方法は長年にわたって利用されているものであり、通常はバックアップ・データセットのサイズが約2分の1に縮小します。また、ターゲットまたはハードウェア・デバイスでのデータ重複除外では、バックアップ・データが重複除外ハードウェア・デバイスに到達した後に、データをディスクに保存する前のインライン処理として、またはバックアップ・ウィンドウ外で行う後処理のいずれかとして、重複除外を行います。この方法では、バックアップに関連するストレージ容量を20分の1~50分の1に縮小できます。ただし、これらの方法では、ネットワークの輻輳(ふくそう:一点に集中すること)、バックアップ・サーバ、インフラストラクチャに関連する問題は解決できません。
バックアップ・データがネットワーク/仮想インフラストラクチャを介して転送される前に実行されるAvamarのデータ重複除外では、バックアップ・データのサイズをソースにおいてグローバルに縮小することにより、日常的に必要なネットワーク帯域幅とバックアップ・ストレージの総容量を大幅に縮小できます。これにより、低速であるか輻輳が生じているネットワークおよび仮想インフラストラクチャにおいても、迅速で効率的なバックアップが可能になります。
羽鳥 正明
EMCジャパン株式会社 マーケティング本部
バックアップ・リカバリ関連製品のプロダクト・マーケティングを担当
次世代のバックアップ・リカバリ・アーカイブ : 次世代バックアップ・リカバリ・アーカイブ
バックアップ・アーカイブ : ITアーキテクチャの再編で内部統制に伴うデータ増大に対応
テクニカル・ホワイトペーパー | ベストプラクティス・プランニング : EMC NetWorker PowerSnapおよびCLARiX用SnapView
バックアップ・アーカイブ : 爆発的に増え続けるデータに対応するバックアップ
バックアップ・アーカイブ : ジョルジオ アルマーニ ジャパン株式会社 様
テクニカル・ホワイトペーパー | ベストプラクティス・プランニング : EMC Symmetrixバックアップ・ストレージ・ソリューション:NetWorker DiskBackup Optionによるディスク・バックアップ・ガイド
ベスト・プラクティス紹介 : CLARiXおよびVMware ESX Serverとともに使用するEMC Replication Manager ベスト・プラクティスのプランニング
バックアップ・アーカイブ : ニホンフラッシュ株式会社 様
バックアップ・アーカイブ : 徳島文理大学 様
バックアップ・アーカイブ : 大阪大学医学部附属病院 様
バックアップの基礎 : なぜITシステムのバックアップは必要なのでしょうか?
無駄なデータの重複を排除するDe-Duplication技術 : グローバル重複除外(重複排除)テクノロジーを利用した次世代のバックアップ技術 (第2回)
無駄なデータの重複を排除するDe-Duplication技術 : グローバル重複除外(重複排除)テクノロジーを利用した次世代のバックアップ技術 (第3回)
無駄なデータの重複を排除するDe-Duplication技術 : グローバル重複除外(重複排除)テクノロジーを利用した次世代のバックアップ技術 (第4回)
テクニカル・ホワイトペーパー | ベストプラクティス・プランニング : ~中堅企業向けOracleデータベース10g/11g用EMCソリューション~
EMC Celerra NSシリーズ・マルチ・プロトコル
統合運用管理 : 静岡県立総合病院 様
バックアップ・アーカイブ : Windowsファイル・アーカイブで、ビジネスの成長に備える
テクニカル・ホワイトペーパー | 高度なテクノロジー : EMC CLARiXデータベース・ストレージ・ソリューション:Oracle 10gおよびOracle 11gとCLARiXの組み合わせにおけるストレージ・レプリケーションの整合性
バックアップ・アーカイブ : ユニアデックス株式会社 様
バックアップ・アーカイブ : 株式会社 ビック東海 様
バックアップ・アーカイブ : クボタシステム開発株式会社 様