方法 AWS Storage Gateway 作業(アーキテクチャ) - AWS Storage Gateway

「翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。」

方法 AWS Storage Gateway 作業(アーキテクチャ)

以下では、現在利用できる AWS Storage Gateway ソリューションのアーキテクチャ的な概要を紹介します。

ファイルゲートウェイ

ファイルゲートウェイ を使用するには、最初に ファイルゲートウェイ の VM イメージをダウンロードします。その後、AWS マネジメントコンソール からか Storage Gateway API により ファイルゲートウェイ をアクティブ化します。ファイルゲートウェイは、Amazon EC2 イメージを使用して作成することもできます。

後 ファイルゲートウェイ がアクティブ化されている場合、ファイル共有を作成して構成し、 Amazon Simple Storage Service (Amazon S3)バケット。これにより、NFS(ネットワーク ファイル システム)プロトコルまたはSMB(サーバ メッセージ ブロック)プロトコルを使用して、クライアントから共有にアクセスできるようになります。ファイル共有に書き込まれたファイルは Amazon S3 内のオブジェクトになり、そのパスがキーになります。ファイルとオブジェクトの間には 1 対 1 のマッピングがあり、ファイルを変更するときに、ゲートウェイは Amazon S3 のオブジェクトを非同期的に更新します。_内の既存のオブジェクト Amazon S3 バケットがファイル システム内にファイルとして表示され、キーがパスになります。オブジェクトは Amazon S3 のサーバー側の暗号化キー (SSE-S3) で暗号化されます。すべてのデータ転送は、HTTPS 経由で実行されます。

このサービスでは、ゲートウェイと AWS 利用可能な帯域幅をよりよく使用するために、マルチパートパラレルアップロードまたはバイトレンジダウンロードを使用します。ローカル・キャッシュは、最近アクセスしたデータへの低レーテンシー・アクセスを提供し、データ・エグレス・チャージを削減するために維持されます。 CloudWatch 仮想マシンのリソース使用と、仮想マシンと仮想マシン間のデータ転送に関する洞察を提供します。 AWS. CloudTrail すべての API 呼び出しを追跡します。

ファイル・ゲートウェイ・ストレージを使用すると、クラウド・ワークロードを Amazon S3、バックアップとアーカイブの実行、階層化、ストレージ データの AWS クラウド。下の図は、Storage Gateway のファイルストレージのデプロイの概要を示しています。

ファイル ゲートウェイは、ファイルのアップロード時にファイルを S3 オブジェクトに変換します。 Amazon S3. ファイル ゲートウェイ上のファイル共有と S3 オブジェクトに対して実行されるファイル操作の相互作用には、ファイルとオブジェクト間の変換時に特定の操作を慎重に考慮する必要があります。

共通ファイル操作はファイルメタデータを変更し、現在の S3 オブジェクトを削除し、新しい S3 オブジェクトを作成します。次の表に、ファイル操作の例と S3 オブジェクトへの影響を示します。

ファイル操作 S3オブジェクトインパクト ストレージ・クラスの意味

ファイル名の変更

既存の S3 オブジェクトを置き換え、各ファイルに対して新しい S3 オブジェクトを作成します。

早期削除料金および検索料金が適用される場合があります

フォルダーの名前変更

すべての既存の S3 オブジェクトを置き換え、フォルダ構造内の各フォルダとファイルに対して新しい S3 オブジェクトを作成します。

早期削除料金および検索料金が適用される場合があります

ファイル/フォルダの権限の変更

既存の S3 オブジェクトを置き換えて、ファイルまたはフォルダごとに新しい S3 オブジェクトを作成します。

早期削除料金および検索料金が適用される場合があります

ファイル/フォルダの所有権の変更

既存の S3 オブジェクトを置き換えて、ファイルまたはフォルダごとに新しい S3 オブジェクトを作成します。

早期削除料金および検索料金が適用される場合があります

ファイルへの追加

既存の S3 オブジェクトを置き換え、各ファイルに対して新しい S3 オブジェクトを作成します。

早期削除料金および検索料金が適用される場合があります

NFSまたはSMBクライアントによってファイルがファイル ゲートウェイに書き込まれると、ファイル ゲートウェイはファイルのデータを Amazon S3 メタデータ(所有権、タイムスタンプなど)が続きます。ファイル データをアップロードすると、S3 オブジェクトが作成され、ファイルのメタデータをアップロードすると、S3 オブジェクトのメタデータが更新されます。この処理によってオブジェクトの別のバージョンが作成され、結果としてオブジェクトの2つのバージョンが作成されます。S3 バージョン管理が有効になっている場合、両方のバージョンが保存されます。

NFSまたはSMBクライアントによるファイル・ゲートウェイ内のファイルの変更が、 Amazon S3ファイルゲートウェイは、ファイル全体をアップロードするのではなく、新しいデータまたは変更したデータをアップロードします。ファイルの変更により、S3オブジェクトの新しいバージョンが作成されます。

ファイル ゲートウェイがより大きなファイルをアップロードする場合、クライアントがファイル ゲートウェイへの書き込みを完了する前に、小さいサイズのファイルをアップロードする必要がある場合があります。これには、キャッシュ領域を解放することや、ファイル共有への書き込み速度を上げることなどが含まれます。これは、S3 バケット内のオブジェクトの複数のバージョンにつながる可能性があります。

オブジェクトを異なるストレージクラスに移動するためのライフサイクルポリシーを設定する前に、S3バケットを監視して、オブジェクトのバージョン数を特定する必要があります。S3 バケット内のオブジェクトに対するバージョン数を最小限に抑えるために、以前のバージョンのライフサイクルの有効期限を構成する必要があります。S3バケット間で同一領域レプリケーション(SRR)またはクロス領域レプリケーション(CRR)を使用すると、使用するストレージが増加します。

ボリュームゲートウェイ

ボリュームゲートウェイの場合、キャッシュ型ボリュームまたは保管型ボリュームのどちらかを使用できます。

キャッシュされたボリュームのアーキテクチャ

キャッシュ型ボリュームを使用することで、頻繁にアクセスされるデータはローカルのストレージゲートウェイに保持しながら、Amazon S3 をプライマリデータストレージとして使用できます。キャッシュ型ボリュームは、オンプレミスのストレージインフラストラクチャをスケールする必要性を最小限に抑えます。同時に、アプリケーションからは引き続き、頻繁にアクセスするデータへの低レイテンシーなアクセスが可能になります。最大32個のストレージ ボリュームを作成できます。 TiB オンプレミスのアプリケーションサーバーからiSCSIデバイスとして接続できます。ゲートウェイは、書き込まれたデータを Amazon S3 に作成されたストレージボリュームに保存し、最近読み込まれたデータはオンプレミスのストレージゲートウェイのキャッシュに保持して、バッファストレージにアップロードします。

キャッシュされたボリュームの範囲は1 GiB ~ 32 TiB 大きさとし、小数第一位を四捨五入して GiB. キャッシュされたボリュームに対して構成された各ゲートウェイは、最大32個のボリュームをサポートでき、合計で最大1.024個のストレージ ボリュームをサポートできます。 TiB (1 PiB)。

キャッシュ型ボリュームによるソリューションでは、AWS Storage Gatewayにより、すべてのオンプレミスのアプリケーションデータは Amazon S3 のストレージボリュームに保存されます。下の図は、キャッシュ型ボリュームデプロイメントの概要を示しています。

Storage Gateway ソフトウェアアプライアンス (VM) をオンプレミスのデータセンターのホストにインストールして起動すると、AWS マネジメントコンソール を使って Amazon S3 によってバックアップされたストレージボリュームをプロビジョニングできるようになります。AWS Storage Gateway API または AWS SDK ライブラリを使って、プログラム的にストレージボリュームをプロビジョニングする方法もあります。次に、そのストレージボリュームをオンプレミスのアプリケーションサーバーに iSCSI デバイスとしてマウントします。

さらにオンプレミスのディスクも VM に割り当てます。ここで割り当てたオンプレミスのディスクは、以下の役割を果たします。

  • ゲートウェイがキャッシュストレージとして使用するディスク – アプリケーションがデータを AWS のストレージボリュームに書き込むとき、ゲートウェイは最初にデータをキャッシュストレージに使用されるオンプレミスのディスクに保存します。次に、ゲートウェイはデータを Amazon S3 にアップロードします。キャッシュストレージは、オンプレミスで耐久性の高い保存場所として、アップロードバッファから Amazon S3 へのアップロードを保留中のデータを保存する働きをします。

    また、キャッシュストレージはアプリケーションが最近アクセスしたデータをオンプレミスに保存し、低レイテンシーでアクセスできるようにもします。アプリケーションがデータをリクエストすると、ゲートウェイはまずキャッシュストレージでそのデータを探し、見つからなければ Amazon S3 で探します。

    キャッシュストレージに割り当てるディスク容量を決定するには、次のガイドラインを使用できます。通常、既存のファイルストアサイズの少なくとも 20% をキャッシュストレージとして割り当てる必要があります。また、キャッシュストレージの容量はアップロードバッファより大きくする必要があります。このガイドラインは、Amazon S3 にまだアップロードされていないアップロードバッファのすべてのデータを永続的に保持するために十分なキャッシュストレージを確保するために有効です。

  • ゲートウェイがアップロードバッファとして使用するディスク – ゲートウェイは、受け取ったデータを Amazon S3 にアップロードする前に、アップロードバッファと呼ばれる待機領域にいったん保存します。ゲートウェイはこのバッファからデータを暗号化 Secure Sockets Layer (SSL) 接続で AWS にアップロードし、そこでデータは暗号化されて Amazon S3 に保存されます。

Amazon S3 にあるストレージボリュームは、増分バックアップ(スナップショットと呼びます)を取得できます。こうしたポイントインタイムのスナップショットは、Amazon S3 にも Amazon EBS スナップショットとして保存されます。新たにスナップショットをとる際には、前回のスナップショット以降に変更されたデータのみが保存されます。スナップショットは、スケジュールに基づいて、または 1 回のみ実行可能です。スナップショットを削除する場合、他のスナップショットが必要ないデータのみが削除されます。の情報については、 Amazon EBS スナップショット、参照 Amazon EBSスナップショット.

データのバックアップを復元する必要がある場合には、Amazon EBS スナップショットをゲートウェイストレージボリュームに復元できます。または、最大16までのスナップショット TiB 新しい Amazon EBS ボリューム。この新しい Amazon EBS ボリュームを Amazon EC2 インスタンスにアタッチできます。

キャッシュボリューム用のすべてのゲートウェイデータとスナップショットデータは、Amazon S3 に保存され、サーバー側の暗号化 (SSE) 機能を使用して保管時に暗号化されます。ただし、このデータには Amazon S3 API や Amazon S3 マネジメントコンソールなどのツールでアクセスすることはできません。

ストアド・ボリューム・アーキテクチャ

保管型ボリュームを使用すると、プライマリデータをローカルに保存する一方で、そのデータを非同期に AWS にバックアップします。保管型ボリュームを使用することにより、オンプレミスのアプリケーションがそのデータセット全体に低レイテンシーでアクセスできます。同時に、耐久性のあるオフサイトのバックアップが提供されます。ストレージボリュームを作成し、それを iSCSI デバイスとしてオンプレミスのアプリケーションサーバーからマウントできます。保管型ボリュームに書き込まれたデータは、オンプレミスのストレージハードウェアに保管されます。このデータは Amazon Elastic Block Store (Amazon EBS) スナップショットとして Amazon S3 に非同期でバックアップされます。

保存ボリュームの範囲は1です。 GiB ~ 16 TiB 大きさとし、小数第一位を四捨五入して GiB. 格納されたボリューム用に構成された各ゲートウェイは、最大32個のボリュームと合計512個のボリューム・ストレージをサポート可能 TiB (0.5 PiB)。

保管型ボリュームでは、ボリュームストレージをオンプレミスのデータセンターに維持します。つまり、アプリケーションデータはすべてオンプレミスのストレージハードウェアに保存されます。その後、ゲートウェイはデータセキュリティの維持に役立つ機能を使用して、コスト効率の高いバックアップと迅速な障害復旧のため、AWS クラウドにデータをアップロードします。すべてのデータに低レイテンシーでアクセスできる必要があるため、データをローカルのオンプレミスに保持したいが、バックアップは AWS に置いておきたいという場合、これは最適なソリューションです。

下の図は、保管型ボリュームのデプロイの概要を示しています。

AWS Storage Gateway ソフトウェアアプライアンス (VM) をオンプレミスのデータセンターのホストにインストールして起動したら、ゲートウェイのストレージボリュームを作成できます。次に、オンプレミスのダイレクトアタッチドストレージ (DAS) またはストレージエリアネットワーク (SAN) ディスクにマッピングできます。起動は、新規ディスクからでも、すでにデータを保持しているディスクからでも行えます。次に、そのストレージボリュームをオンプレミスのアプリケーションサーバーに iSCSI デバイスとしてマウントします。オンプレミスのアプリケーションがゲートウェイのストレージボリュームに対してデータの読み書きを行う時、そのデータはボリュームに割り当てられたディスクに保存され、読み込まれます。

データを Amazon S3 にアップロードする前に、ゲートウェイは受け取ったデータをアップロードバッファと呼ばれる待機領域にいったん保存します。作業用ストレージとしてオンプレミスの DAS または SAN ディスクが使用できます。ゲートウェイはデータをアップロードバッファから、暗号化 Secure Sockets Layer (SSL) 接続経由で、AWS クラウドで実行される AWS Storage Gateway サービスにアップロードします。ここでデータは暗号化されて Amazon S3 に保存されます。

ストレージボリュームは、増分バックアップ (スナップショットと呼びます) をとることができます。ゲートウェイは、こうしたスナップショットを Amazon S3 に Amazon EBS スナップショットとして保存します。新たにスナップショットをとる際には、前回のスナップショット以降に変更されたデータのみが保存されます。スナップショットは、スケジュールに基づいて、または 1 回のみ実行可能です。スナップショットを削除する場合、他のスナップショットが必要ないデータのみが削除されます。

データのバックアップを復元する必要がある場合には、Amazon EBS スナップショットをオンプレミスのゲートウェイストレージボリュームに復元できます。このスナップショットから新たに Amazon EBS ボリュームを作成し、それを Amazon EC2 インスタンスにアタッチすることもできます。

テープゲートウェイ

テープゲートウェイ は、データを AWS クラウドにアーカイブすることで、耐久性が高くコスト効率的なソリューションを提供します。仮想テープライブラリ (VTL) のインターフェイスを使用することで、既存のテープベースのバックアップインフラストラクチャを利用して、テープゲートウェイ 上に作成する仮想テープカートリッジにデータを保存できます。各 テープゲートウェイ にはメディアチェンジャーとテープドライブがあらかじめ組み込まれています。これらは、既存のクライアントバックアップアプリケーションから iSCSI デバイスとして利用できます。データをアーカイブするには、必要に応じてテープカートリッジを追加します。

次の図は、テープゲートウェイ デプロイメントの概要を示しています。

この図では、次に使用されている テープゲートウェイ 構成要素を特定します。

  • 仮想テープ – 仮想テープは物理テープカートリッジに似ています。ただし、仮想テープデータは AWS クラウドに保存されます。物理テープと同様、仮想テープには空白のものもデータが書き込まれたものもあります。仮想テープを作成するには、Storage Gateway コンソールを使うか、プログラムから Storage Gateway API を利用します。各ゲートウェイには、最大1.500個のテープまたは最大1個の PiB テープ・データの合計の1回あたりの値。テープの作成時に構成できる各仮想テープのサイズは100です。 GiB および5 TiB.

  • 仮想テープライブラリ (VTL) – VTL は、オンプレミスで利用できる、ロボットアームとテープドライブを備えた物理テープライブラリに似ています。VTL には、保存されている仮想テープのコレクションが含まれています。VTL は各 テープゲートウェイ に 1 つ組み込まれています。

    仮想テープを作成すると、ゲートウェイの VTL に表示されます。VTL 内のテープは Amazon S3 によってバックアップされます。バックアップソフトウェアがゲートウェイにデータを書き込むと、ゲートウェイはそのデータをローカルに保存した後、VTL 内の仮想テープ (Amazon S3) に非同期的にアップロードします。

    • テープドライブ – VTL テープドライブは物理テープドライブに相当し、テープへの I/O やシーク操作を行います。各 VTL には、テープドライブが 10 セット組み込まれており、バックアップアプリケーションから iSCSI デバイスとして使用することができます。

    • メディアチェンジャー – VTL メディアチェンジャーは、物理テープライブラリの保管スロットやテープドライブにテープを出し入れするロボットにあたるものです。各 VTL にはメディアチェンジャーが 1 つ組み込まれており、バックアップアプリケーションから iSCSI デバイスとして使用することができます。

  • アーカイブ – アーカイブは現実でいえばオフサイトのテープ保管施設にあたります。ゲートウェイ VTL からアーカイブに仮想テープをアーカイブできます。必要に応じて、アーカイブからゲートウェイ VTL にテープを取得できます。

    • テープのアーカイブ – バックアップソフトウェアがテープを取り出すと、ゲートウェイは長期保存のためにテープをアーカイブに移動します。アーカイブは、ゲートウェイをアクティブ化した AWS リージョン内にあります。アーカイブ内のテープは仮想テープシェルフ (VTS) に保存されます。VTS は S3 Glacier または S3 GlacierDeep Archive (データのアーカイブ、バックアップ、長期データ保持のための低コストのストレージサービス) によってサポートされます。

    • テープの取り出し – アーカイブされたテープは、直接読み取ることができません。アーカイブされたテープを読み取るには、まず、Storage Gateway コンソールまたは Storage Gateway API を使用して、テープゲートウェイ に取り出す必要があります。

      重要

      テープを GLACIER にアーカイブした場合、通常 3 〜 5 時間以内に取り出すことができます。テープを DEEP_ARCHIVE にアーカイブした場合、通常 12 時間以内に取り出すことができます。

テープゲートウェイ をデプロイし起動したら、仮想テープドライブとメディアチェンジャーを iSCSI デバイスとして、オンプレミスのアプリケーションサーバーにマウントします。必要なだけ仮想テープを作成します。次に、既存のバックアップソフトウェアアプリケーションを使ってデータを仮想テープに書き込みます。メディアチェンジャーは仮想テープを仮想テープドライブに装填/排出し、読み書き操作ができるようにします。

ゲートウェイ仮想マシンのローカルディスクを割り当てる

ゲートウェイ VM には、以下の目的のために割り当てるローカルディスクが必要です。

  • キャッシュストレージ – アップロードバッファから Amazon S3 へのアップロードを保留中のデータを保存する、耐久性の高い保管場所となります。

    アプリケーションが仮想テープからデータを読み込むと、そのデータはキャッシュストレージに保存されます。最近アクセスがあったデータもキャッシュストレージに保存され、低レイテンシーでアクセスできるようにします。アプリケーションがテープのデータをリクエストすると、ゲートウェイはまずキャッシュストレージでそのデータを探し、見つからない場合は AWS からデータをダウンロードします。

  • アップロードバッファ – データが仮想テープにアップロードする前に集められる場所となります。また、アップロードバッファは予期しない障害からテープを復元するための復元ポイントを作成する際にも重要な役割を果たします。詳細については、を参照してください 正常に機能していない から仮想テープを復旧する必要があるテープゲートウェイ

バックアップアプリケーションがデータをゲートウェイに書き込むと、ゲートウェイはそのデータをキャッシュストレージとアップロードバッファの両方にコピーします。次に、書き込みオペレーションの完了をバックアップアプリケーションに対して確認します。

キャッシュストレージおよびアップロードバッファに割り当てるディスク容量のガイドラインについては、「ローカルディスクストレージの容量の決定」を参照してください。