S3 Glacier アーカイブの取得 - Amazon S3 Glacier

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

S3 Glacier アーカイブの取得

Amazon S3 Glacier からアーカイブから取り出すのは非同期オペレーションであり、最初にジョブを開始し、次にジョブが完了した後で出力をダウンロードします。アーカイブの取り出しジョブを開始するには、ジョブの開始 (ジョブの POST)REST API オペレーションまたは同等のAWS CLI、またはAWSSDK。

S3 Glacier からアーカイブを取り出すプロセスは、2 つのステップに分かれます。

アーカイブを取り出すには

  1. アーカイブの取得ジョブを開始します。

    1. 取得するアーカイブの ID を入手します。アーカイブ ID は、ボールトのインベントリから取得できます。アーカイブ ID は、。AWS CLI, またはAWSSDK。詳細については、「Amazon S3 Glacier でボールトインベントリをダウンロードする」を参照してください。

    2. を使用して、S3 Glacier に対してアーカイブ全体またはアーカイブの一部をダウンロードするための準備をリクエストするジョブを開始します。ジョブの開始 (ジョブの POST)オペレーション.

    ジョブを開始すると、S3 Glacier ではレスポンスでジョブ ID を返し、ジョブを非同期的に実行します (ステップ 2 で説明したように、ジョブが完了するまではジョブの出力をダウンロードできません)。

    重要

    標準取り出しの場合のみ、データ取り出しポリシーにより、Initiate Jobリクエストして失敗リクエストするPolicyEnforcedException例外。データ取り出しポリシーの詳細については、「S3 Glacier のデータ取り出しポリシー」を参照してください。PolicyEnforcedException 例外の詳細については、「エラーレスポンス」を参照してください。

    必要に応じて、S3 Glacier に保存されたデータの大きなセグメントを復元できます。S3 Glacier ストレージクラスからのデータの復元については、「」を参照してください。オブジェクトのアーカイブに適したストレージクラスAmazon Storage Service ユーザーガイド

  2. ジョブが完了したら、を使用してバイトをダウンロードします。ジョブの出力の取得 (GET output)オペレーション.

    全バイトをダウンロードすることも、バイト範囲を指定してジョブの出力の一部だけをダウンロードすることもできます。出力が大きい場合には、出力をチャンクに分けてダウンロードすると、ネットワーク障害など、ダウンロードに関する障害が発生したときに便利です。1 回のリクエストでジョブの出力を取得する場合に、ネットワーク障害が発生すると、最初から出力のダウンロードをやり直さなければならなくなります。これに対して、出力をチャンクに分けてダウンロードしていれば、障害が発生した場合でも、全体ではなく、出力の一部のダウンロードをやり直せば済みます。

S3 Glacier では、出力を取得する前にジョブを完了している必要があります。ジョブは、完了から少なくとも 24 時間は有効です。つまり、ジョブが完了してから 24 時間は、出力をダウンロードできます。ジョブが完了しているかどうかを判断するには、以下のオプションの 1 つを使用してジョブのステータスを確認します。

  • ジョブ完了通知を待つ— ジョブの完了後に S3 Glacier が通知を投稿する Amazon Simple Notification Service (Amazon SNS) トピックを指定できます。S3 Glacier は、ジョブの完了後にのみ通知を送信します。

    ジョブを開始する際に、Amazon SNS トピックを指定できます。ジョブのリクエストで指定された Amazon SNS トピックのほか、ボールトにアーカイブの取得イベントに関する通知がある場合には、S3 Glacier からその SNS トピックにも通知が発行されます。詳細については、「Amazon S3 Glacier でのボールト通知の設定」を参照してください。

  • ジョブ情報を明示的に要求する— S3 Glacier も使用できます。Describe JobAPI オペレーション (ジョブの説明 (GET JobID)) をクリックして、ジョブ情報を定期的にポーリングします。ただし、Amazon SNS 通知を使用することをお勧めします。

注記

Amazon SNS 通知を使用して取得する情報は、Describe JobAPI オペレーション。

アーカイブの取り出しオプション

アーカイブから取り出すジョブを開始するときは、アクセス時間とコスト要件に基づいて、以下の取得オプションのいずれかを指定できます。取り出し料金については、「」を参照してください。Amazon S3 Glacier の料金

  • 迅速-迅速取り出しを使用すると、アーカイブのサブセットのリクエストが緊急で必要になったときに、S3 Glacier ストレージクラスまたは S3 Intelligent-Tiering Archive アクセス階層に保存されているデータに、すばやくアクセスできます。最大規模のアーカイブ (250 MB 以上) を除くすべてのアーカイブについては、迅速取り出しでアクセスしたデータは通常 1〜5 分以内で使用可能になります。プロビジョンドキャパシティーは、迅速取り出しの取得容量を必要なときに利用できることを保証します。詳細については、「プロビジョンドキャパシティー」を参照してください。

  • Standard— 標準取り出しでは、数時間以内にすべてのアーカイブにアクセスできます。通常、標準取り出しは 3〜5 時間以内に完了します。標準取り出しは、取り出しオプションを指定しないで取り出しリクエストを行った場合にデフォルトで適用されます。

  • 大容量-大容量取り出しは、S3 の最も安価な取り出しオプションであり、これを使用して大量のデータ (ペタバイトのデータを含む) を 1 日以内に低コストで取得できます。通常、大容量取り出しは 5〜12 時間で完了します。

お急ぎ便、標準、または一括取り出しを行うには、Tierパラメータの SDKジョブの開始 (ジョブの POST)必要なオプションへの REST API リクエスト、またはAWS CLIまたはAWSSDK。プロビジョンドキャパシティーを購入した場合、すべての Expedited 取り出しはプロビジョンドキャパシティーを通じて自動的に提供されます。

プロビジョンドキャパシティー

プロビジョンドキャパシティーは、迅速取り出しの取得容量を必要なときに利用できることを保証します。容量の各単位について 5 分ごとに 3 回以上の迅速取り出しを提供し、最大 150 MBps の取り出しスループットを提供します。

ワークロードからデータのサブセットにアクセスする際に非常に高い信頼性と予測可能性が求められる場合は、プロビジョニングされた取得容量を購入することをお勧めします。プロビジョンドキャパシティーがなくても、通常、需要が異常に高い例外的な場合を除いては、迅速取り出しが受け入れられます。ただし、環境を問わず、どのような場合でも迅速取り出しにアクセスするには、プロビジョニングされた取得容量を購入してください。

プロビジョニングされた容量の購入

プロビジョニングされた容量単位を購入するには、S3 Glacier コンソールを使用して購入できます。プロビジョニングされた容量の購入 (POST provisioned-capacity)REST API オペレーション、AWSSDK、またはAWS CLI。プロビジョニングされた容量の料金情報については、「」を参照してください。Amazon S3 Glacier の料金

プロビジョニングされた容量単位は、購入日時から 1 か月間有効です。

開始日が 31 日の場合、有効期限は翌月の最終日となります。たとえば、開始日が 8 月 31 日の場合、有効期限は 9 月 30 日です。開始日が 1 月 31 日の場合、有効期限は 2 月 28 日です。

Amazon S3 Glacier コンソールを使用してプロビジョニングされた容量を購入するには

  1. にサインインします。AWS Management Consoleでの S3 Glacier コンソールを開きます。https://console.aws.amazon.com/glacier/

  2. 左のナビゲーションペインで、データ取り出し設定

  3. []プロビジョニングされたキャパシティーユニット (PCU)、選択PCU を購入する。-PCU を購入するダイアログボックスが表示されます。

  4. プロビジョニングされた容量を購入する場合は、次のように入力します。confirm購入を確認するにはボックスに移動するとそのように表示されます。

  5. 選択PCU を購入する

アーカイブの取得範囲

S3 Glacier からアーカイブを取得するときには、取得するアーカイブの範囲 (部分) をオプションで指定することもできます。デフォルトでは、アーカイブの全体が取得されます。バイト範囲を指定すると、以下のことを行う場合に便利です。

  • データダウンロードを管理する— S3 Glacier では、取り出しリクエストが完了してから 24 時間、取得したデータをダウンロードできます。このため、アーカイブの一部だけを取得することによって、特定のダウンロード期間内のダウンロードのスケジュールを管理できます。

  • サイズの大きなアーカイブの特定の一部のみ取得 - たとえば、以前に多くのファイルをまとめ、1 つのアーカイブとしてアップロードしたものの、その後、ファイルの一部のみを取得する必要が生じたとします。このような場合には、取得リクエストを 1 回使用して、必要なファイルが含まれるアーカイブから一定の範囲を指定できます。このほか、取得リクエストを複数回、1 回ごとに 1 つまたは複数のファイルから成る範囲を指定して送信する方法もあります。

範囲取得を使用して取得ジョブを開始した場合には、メガバイト単位に調整した範囲を指定する必要があります。つまり、バイト範囲の始点はゼロ (アーカイブの先頭) またはその後 1 MB 間隔 (1 MB、2 MB、3 MB など) の点を指定することができます。

レンジの終わりの値には、アーカイブの末尾、またはレンジの開始値より大きな任意の 1 MB 間隔の数値のいずれかを指定できます。このほか、(取得ジョブが完了した後で) データをダウンロードする際にチェックサムの値を取得する場合には、ジョブの開始時にリクエストする範囲が木構造ハッシュ可能になっている必要があります。チェックサムを使用して、データが送信中に破損しなかったことを確認できます。メガバイト単位への調整と木構造ハッシュを可能にするための調整については、「データをダウンロードするときのチェックサムの受信」を参照してください。