Abrufen von S3-Glacier-Archiven mithilfe der AWS-Konsole - Amazon S3 Glacier

Wenn Sie mit dem Archivierungsspeicher in Amazon Simple Storage Service (Amazon S3) noch nicht vertraut sind, empfehlen wir Ihnen, sich zunächst über die S3-Glacier-Speicherklassen in Amazon S3 (S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval und S3 Glacier Deep Archive) zu informieren. Weitere Informationen finden Sie unter S3 Glacier-Speicherklassen und Speicherklassen für die Archivierung von Objekten im Amazon S3 S3-Benutzerhandbuch.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Abrufen von S3-Glacier-Archiven mithilfe der AWS-Konsole

Das Abrufen eines Archivs aus Amazon S3 Glacier ist ein asynchroner Vorgang. Dabei wird zuerst ein Auftrag initiiert und anschließend nach Abschluss des Auftrags die Ausgabe heruntergeladen. Zum Initiieren eines Auftrags zum Abrufen eines Archivs können Sie den entsprechenden Vorgang in der Initiate Job (POST jobs)-REST-API oder den entsprechenden Befehl in der AWS CLI oder in den AWS-SDKs verwenden.

Das Abrufen eines Archivs aus S3 Glacier ist ein zweistufiger Prozess.

So rufen Sie ein Archiv ab
  1. Initiieren eines Auftrags zum Abrufen eines Archivs

    1. Ermitteln Sie die ID des Archivs, das Sie abrufen möchten. Sie finden die Archiv-ID in einer Inventarliste des Tresors. Sie können die Archiv-ID mit der REST-API, AWS CLI oder den AWS-SDKs abrufen. Weitere Informationen finden Sie unter Herunterladen eines Tresorinventars in Amazon S3 Glacier.

    2. Initiieren Sie mit dem Initiate Job (POST jobs)-Vorgang einen Auftrag, mit dem Sie S3 Glacier anweisen, ein vollständiges Archiv oder einen Teil eines Archivs zum Herunterladen vorzubereiten.

    Wenn Sie einen Auftrag initiieren, gibt S3 Glacier als Antwort eine Auftrags-ID zurück und führt den Auftrag asynchron aus. (Sie können die Auftragsausgabe erst herunterladen, nachdem der Auftrag wie in Schritt 2 beschrieben abgeschlossen wurde.)

    Wichtig

    Bei Standardabrufen kann eine Richtlinie für den Datenabruf dazu führen, dass die Initiate Job-Anforderung zu einer PolicyEnforcedException-Ausnahme führt und fehlschlägt. Weitere Informationen zu Datenabrufrichtlinien finden Sie unter Richtlinien für den Datenabruf in S3 Glacier. Weitere Informationen zur PolicyEnforcedException-Ausnahme finden Sie unter Fehlermeldungen.

    Bei Bedarf können Sie große Segmente der in S3 Glacier gespeicherten Daten wiederherstellen. Weitere Informationen zum Wiederherstellen von Daten aus den S3-Glacier-Speicherklassen finden Sie unter Speicherklassen für die Archivierung von Objekten im Benutzerhandbuch für Amazon Simple Storage Service.

  2. Laden Sie nach Abschluss des Auftrags die Bytes mit der Operation Get Job Output (GET output) herunter.

    Sie können alle Bytes herunterladen oder einen Bytebereich festlegen, sodass nur ein Teil der Auftragsausgabe heruntergeladen wird. Bei einer größeren Ausgabemenge bietet es sich an, die Ausgabe in Datenblöcken herunterzuladen, um Fehlern beim Herunterladen, wie z. B. durch einen Ausfall des Netzwerks, vorzubeugen. Wenn Sie eine einzige Anforderung zum Abrufen der gesamten Auftragsausgabe übermitteln, sind Sie bei Netzwerkausfällen gezwungen, den Vorgang zum Herunterladen der Ausgabe von Anfang an neu zu starten. Wenn Sie die Ausgabe jedoch in Datenblöcken herunterladen, müssen Sie bei einem Fehler nur den betroffenen Teil der Ausgabe und nicht die gesamten Ausgabedaten erneut herunterladen.

S3 Glacier muss einen Auftrag zuerst abschließen, bevor Sie die Ausgabe abrufen können. Nachdem ein Auftrag abgeschlossen wurde, bleibt er 24 Stunden lang verfügbar. Sie haben also 24 Stunden Zeit, um nach Beendigung des Auftrags die Ausgabe herunterzuladen. Verwenden Sie eine der folgenden Optionen, um den Status des Auftrags zu überprüfen und festzustellen, ob der Auftrag abgeschlossen ist:

  • Auf eine Benachrichtigung über den Abschluss des Auftrags warten: Sie können ein Amazon Simple Notification Service (Amazon SNS)-Thema angeben, an das S3 Glacier nach Abschluss des Auftrags eine Benachrichtigung senden kann. Die Benachrichtigung wird erst gesendet, nachdem S3 Glacier den Auftrag abgeschlossen hat.

    Beim Initiieren eines Auftrags können Sie ein Amazon-SNS-Thema für den Auftrag angeben. Wenn Sie in der Auftragsanforderung ein Amazon-SNS-Thema angegeben haben und außerdem für den Tresor Benachrichtigungen bei Archivabrufereignissen festgelegt wurden, veröffentlicht S3 Glacier auch eine Benachrichtigung im entsprechenden SNS-Thema. Weitere Informationen finden Sie unter Konfigurieren von Tresorbenachrichtigungen in Amazon S3 Glacier.

  • Auftragsinformationen explizit anfordern: Sie können auch den API-Vorgang Describe Job (Describe Job (GET JobID)) in S3 Glacier verwenden, um regelmäßig Auftragsinformationen abzufragen. Wir empfehlen jedoch die Verwendung von Amazon-SNS-Benachrichtigungen.

Anmerkung

Die Informationen, die Sie in der Amazon-SNS-Benachrichtigung erhalten, sind identisch mit den Informationen, die Sie durch Aufrufen des Describe Job-API-Vorgangs erhalten.

Archiv-Abrufoptionen

Entsprechend den Anforderungen im Hinblick auf Zugriffszeit und Kosten können Sie beim Initiieren eines Auftrags zum Abrufen eines Archivs die folgenden Einstellungen festlegen. Weitere Informationen zu Abrufpreisen finden Sie unter S3 Glacier – Preise.

  • Expedited – Hiermit können Sie schnell auf Ihre Daten zugreifen, die in der Speicherklasse „S3 Glacier Flexible Retrieval“ oder der S3-Intelligent-Tiering-Archivzugriffsebene gespeichert sind, wenn gelegentliche dringende Anforderungen für die Wiederherstellung von Archiven erforderlich sind. Daten, die unter Verwendung von „Expedited“ abgerufen werden, stehen normalerweise innerhalb von 1 bis 5 Minuten zur Verfügung, außer wenn es sich um sehr große Archive (über 250 MB) handelt. Die bereitgestellte Kapazität stellt sicher, dass für Expedited-Abrufe Abrufkapazität verfügbar ist, wenn Sie sie benötigen. Weitere Informationen finden Sie unter Bereitgestellte Kapazität.

  • Standard – Standardabrufe ermöglichen Ihnen den Zugriff auf alle Ihre Archive innerhalb einiger Stunden. Standardabrufe werden in der Regel innerhalb von 3 bis 5 Stunden ausgeführt. Standard ist die Standardoption für Abrufanforderungen, in denen keine Abrufoption angegeben ist.

  • Bulk – Bulk-Abrufe sind die kostengünstigste S3-Glacier-Abrufoption. Hiermit können Sie große Mengen von Daten (sogar im Petabyte-Umfang) pro Tag kostengünstig abrufen. Bulk-Abrufe werden in der Regel innerhalb von 5 bis 12 Stunden ausgeführt.

Die folgende Tabelle fasst die Archivabrufoptionen zusammen. Informationen zu Preisen finden Sie unter Amazon S3 Glacier-Preise.

Service Expedited (Beschleunigt) Standard Bulk (Masse)

Amazon S3 Glacier

1-5 Minuten

3-5 Stunden

5-12 Stunden

Wenn Sie einen Expedited-, Standard- oder Bulk-Abruf durchführen möchten, legen Sie das Tier-Anforderungselement in der REST-API-Operationsanforderung RestoreObject auf die gewünschte Option fest bzw. auf das Äquivalent in der AWS Command Line Interface (AWS CLI) oder den AWS-SDKs. Wenn Sie bereitgestellte Durchsatzkapazität gekauft haben, werden alle Expedited-Abrufe automatisch über Ihre bereitgestellte Kapazität erledigt.

Bereitgestellte Kapazität

Die bereitgestellte Kapazität hilft sicherzustellen, dass für Expedited-Abrufe Abrufkapazität verfügbar ist, wenn Sie sie benötigen. Jede Kapazitätseinheit gewährleistet, dass alle fünf Minuten mindestens drei Expedited-Abrufe ausgeführt werden können, und bietet bis zu 150 MB/s Abrufdurchsatz.

Sie sollten bereitgestellte Abrufkapazität kaufen, wenn Ihre Workload einen sehr zuverlässigen und vorhersehbaren Zugriff auf eine Untermenge Ihrer Daten innerhalb von Minuten erforderlich macht. Ohne bereitgestellte Kapazität werden Expedited-Abrufe normalerweise akzeptiert, außer in seltenen Situationen unüblich hoher Nachfrage. Wenn Sie unbedingt Zugriff auf Expedited-Abrufe benötigen, müssen Sie auf alle Fälle eine bereitgestellte Abrufkapazität kaufen.

Kaufen von bereitgestellter Durchsatzkapazität

Sie können bereitgestellte Kapazitätseinheiten über die S3-Glacier-Konsole, die Purchase Provisioned Capacity (POST provisioned-capacity)-REST-API, die AWS-SDKs oder die AWS CLI kaufen. Weitere Informationen zu den Preisen für die bereitgestellte Kapazität finden Sie unter Amazon S3 Glacier – Preise.

Eine bereitgestellte Kapazitätseinheit ist ab dem Datum und der Uhrzeit des Kaufs einen Monat lang gültig.

Wenn das Startdatum der 31. Tag eines Monats ist, dann ist der letzte Tag des nächsten Monats das Ablaufdatum. Beispiel: Ist das Startdatum der 31. August, dann ist der 30. September das Ablaufdatum. Ist das Startdatum der 31. Januar, dann ist der 28. Februar das Ablaufdatum.

So erwerben Sie bereitgestellte Kapazität mithilfe der Amazon-S3-Glacier-Konsole
  1. Melden Sie sich bei der AWS Management Console an und öffnen Sie die S3-Glacier-Konsole unter https://console.aws.amazon.com/glacier/home.

  2. Wählen Sie im Navigationsbereich auf der linken Seite Datenabruf-Einstellungen aus.

  3. Wählen Sie unter Bereitgestellte Kapazitätseinheiten (PCUs) die Option PCU kaufen aus. Das Dialogfeld PCU kaufen wird angezeigt.

  4. Wenn Sie bereitgestellte Kapazität erwerben möchten, geben Sie confirm im Feld Kauf bestätigen ein.

  5. Wählen Sie PCU kaufen aus.

Abrufen von Archivbereichen

Beim Abrufen eines Archivs von S3 Glacier haben Sie die Möglichkeit, nur einen bestimmten Bereich bzw. einen Teil des Archivs abzurufen. In der Standardeinstellung wird das vollständige Archiv abgerufen. In den folgenden Fällen ist es von Vorteil einen bestimmten Bereich von Bytes anzugeben:

  • Verwalten von Datendownloads: Mit S3 Glacier können abgerufene Daten nach Abschluss der Abrufanforderung 24 Stunden lang heruntergeladen werden. Sie können also einzelne Bereiche des Archivs separat herunterladen, um den gesamten Download-Vorgang über den verfügbaren Zeitraum zu verteilen.

  • Abrufen eines bestimmten Teils eines großen Archivs: Es kann beispielsweise vorkommen, dass Sie in der Vergangenheit viele Dateien aggregiert und zusammen in ein einziges Archiv hochgeladen haben, jetzt aber nur eine kleine Auswahl der Dateien abrufen möchten. In diesem Fall können Sie einen Bereich des Archivs angeben, der die gewünschten Dateien enthält, und eine Abrufanforderung übermitteln. Sie können allerdings auch mehrere Abrufanforderungen initiieren, die jeweils für einen Bereich mit einer oder mehreren Dateien gelten.

Beim Initiieren eines Abrufauftrags für bestimmte Bereiche müssen Sie sich bei der Angabe des Bereichs auf Megabytes beziehen. Das heißt, dass der Bytebereich bei null (am Anfang des Archivs) oder bei jedem nachfolgenden vollen Megabytewert beginnen kann (1 MB, 2 MB, 3 MB usw.).

Das Ende des Bereichs kann entweder das Ende Ihres Archivs oder ein beliebiges 1-MB-Intervall sein, das größer als der Anfang Ihres Bereichs ist. Wenn Sie beim Herunterladen der Daten Prüfsummenwerte erhalten möchten (nach Beendigung des Abrufauftrags), muss der Bereich, den Sie bei der Auftragsinitiierung anfordern, außerdem mit dem Struktur-Hash abgeglichen werden. Mithilfe von Prüfsummen können Sie sicherstellen, dass die Daten bei der Übertragung nicht beschädigt wurden. Weitere Informationen zum Megabyte- und Struktur-Hash-Abgleich finden Sie unter Erhalten von Prüfsummen bei Daten-Download.