Extraction d'archives S3 Glacier à l'aide de la console AWS - Amazon S3 Glacier

Cette page est réservée aux clients existants du service S3 Glacier utilisant Vaults et l'original REST API de 2012.

Si vous recherchez des solutions de stockage d'archives, nous vous conseillons d'utiliser les classes de stockage S3 Glacier dans Amazon S3, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive. Pour en savoir plus sur ces options de stockage, consultez les sections Classes de stockage S3 Glacier et Stockage de données à long terme à l'aide des classes de stockage S3 Glacier dans le guide de l'utilisateur Amazon S3. Ces classes de stockage utilisent Amazon S3API, sont disponibles dans toutes les régions et peuvent être gérées au sein de la console Amazon S3. Ils offrent des fonctionnalités telles que l'analyse des coûts de stockage, Storage Lens, des fonctionnalités de chiffrement optionnelles avancées, etc.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Extraction d'archives S3 Glacier à l'aide de la console AWS

L'extraction d'une archive depuis Amazon S3 Glacier est une opération asynchrone qui consiste d'abord à lancer une tâche, puis à télécharger la sortie après que la tâche s'est terminée. Pour lancer une tâche d'extraction d'archive, vous devez utiliser l'opération d'API REST Initier une tâche (POSToffres d'emploi) ou l'équivalent dans l'interface AWS CLI, ou les kits SDK AWS.

L'extraction d'une archive depuis S3 Glacier est un processus en deux étapes.

Pour récupérer une archive
  1. Lancez une tâche d'extraction d'archive.

    1. Obtenez l'ID de l'archive que vous souhaitez extraire. Vous pouvez obtenir l'ID de l'archive à partir d'un inventaire du coffre. Vous pouvez obtenir l'ID de l'archive avec l'API REST, l'interface AWS CLI ou les kits SDK AWS. Pour de plus amples informations, veuillez consulter Téléchargement d'un inventaire de coffre dans Amazon S3 Glacier.

    2. Lancez une tâche qui demande à S3 Glacier de préparer une archive entière ou une partie de celle-ci au téléchargement à venir à l'aide de l'opération Initier une tâche (POSToffres d'emploi).

    Lorsque vous lancez une tâche, S3 Glacier renvoie un ID de tâche dans la réponse et exécute la tâche de manière asynchrone. (Vous ne pouvez pas télécharger la sortie de la tâche tant que celle-ci n'est pas terminée, comme indiqué à l'étape 2.)

    Important

    Pour les extractions de type Standard uniquement, une politique d'extraction de données peut entraîner l'échec de votre demande Initiate Job avec une exception PolicyEnforcedException. Pour plus d'informations sur les stratégies d'extraction de données, consultez la section Politiques d'extraction de données S3 Glacier. Pour plus d'informations sur l'exception PolicyEnforcedException, consultez la section Réponses d'erreur.

    Si nécessaire, vous pouvez restaurer des segments importants des données stockées dans S3 Glacier. Pour plus d'informations sur la restauration des données à partir des classes de stockage S3 Glacier, consultez Classes de stockage pour l'archivage d'objets dans le Guide de l'utilisateur Amazon Simple Storage Service.

  2. Une fois la tâche terminée, téléchargez les octets à l'aide de l'opération Génération de sortie de tâche (GET output).

    Vous pouvez télécharger tous les octets ou spécifier une plage d'octets afin de télécharger une seule partie de la sortie de la tâche. Pour les sorties plus volumineuses, le téléchargement en plusieurs parties s'avère utile en cas d'échec du téléchargement, par exemple en raison d'une défaillance réseau. Si vous générez la sortie de la tâche dans le cadre d'une seule demande et qu'une défaillance réseau se produit, vous devez redémarrer le téléchargement de la sortie depuis le début. En revanche, si vous téléchargez la sortie en plusieurs parties et qu'une défaillance se produit, vous devez uniquement redémarrer le téléchargement de la partie et non celui de la sortie entière.

S3 Glacier doit avoir terminé une tâche avant que vous puissiez en obtenir la sortie. Après son achèvement, une tâche n'expire pas avant au moins 24 heures, ce qui signifie que vous disposez d'un délai de 24 heures pour télécharger la sortie une fois la tâche terminée. Pour déterminer si votre tâche est terminée, vérifiez son état en utilisant l'une des options suivantes :

  • Attendre la notification d'achèvement de la tâche : vous pouvez spécifier une rubrique Amazon Simple Notification Service (Amazon SNS) dans laquelle S3 Glacier peut publier une notification après que la tâche a abouti. S3 Glacier n'envoie la notification qu'après l'achèvement de la tâche.

    Vous pouvez spécifier une rubrique Amazon SNS pour une tâche au moment où vous la lancez. Outre la spécification d'une rubrique Amazon SNS dans la demande de tâche, si des notifications sont définies pour les événements d'extraction d'archive au niveau du coffre, S3 Glacier publie également une notification dans cette rubrique SNS. Pour de plus amples informations, veuillez consulter Configuration des notifications de coffre dans Amazon S3 Glacier.

  • Demander explicitement des informations sur la tâche : vous pouvez également utiliser l'opération d'API S3 Glacier Describe Job (Description de la tâche (GET JobID)) pour demander périodiquement des informations sur la tâche. Cependant, nous vous recommandons d'utiliser des notifications Amazon SNS.

Note

Les informations que vous obtenez en utilisant une notification Amazon SNS sont identiques à celles obtenues en appelant l'opération d'API Describe Job.

Options de récupération des archives

Lorsque vous lancez une tâche en vue d'extraire une archive, vous pouvez spécifier l'une des options d'exaction suivantes, en fonction de vos exigences en matière de temps d'accès et de coûts. Pour en savoir plus sur la tarification des extractions, consultez Tarification Amazon S3 Glacier.

  • Expedited : les extractions de type Expedited vous permettent d'accéder rapidement à vos données stockées dans la classe de stockage S3 Glacier Flexible Retrieval ou au niveau Accès aux archives S3 Intelligent-Tiering lorsque des demandes urgentes occasionnelles de restauration d'archives se présentent. Pour toutes les archives à l'exception des plus volumineuses (plus de 250 Mo), les données auxquelles vous accédez à l'aide des extractions Expedited sont généralement disponibles dans un délai compris entre 1 et 5 minutes. La capacité provisionnée garantit que la capacité des récupérations rapides est disponible lorsque vous en avez besoin. Pour de plus amples informations, veuillez consulter Capacité provisionnée.

  • Standard : les extractions de type Standard vous permettent d'accéder à vos archives en plusieurs heures. Les extractions Standard prennent généralement entre 3 et 5 heures. Standard constitue l'option par défaut pour les demandes de récupération qui ne spécifient pas l'option de récupération.

  • Bulk : les extractions de type Bulk constituent l'option d'extraction S3 Glacier la plus économique. Elle vous permet d'extraire de grandes quantités de données (jusqu'à plusieurs pétaoctets) à peu de frais dans une même journée. Les extractions Bulk prennent généralement entre 5 et 12 heures.

Le tableau suivant récapitule les options de récupération d'archive. Pour de plus amples informations sur la tarification, veuillez consulter Tarification Amazon S3 Glacier.

Service Accéléré Standard Volume

Amazon S3 Glacier

1 à 5 minutes

3 à 5 heures

5 à 12 heures

Pour effectuer une récupération Expedited, Standard ou Bulk, définissez l'élément de demande Tier de la demande d'opération d'API REST RestoreObject sur l'option que vous souhaitez, ou choisissez l'équivalent dans l'AWS Command Line Interface (AWS CLI) ou les kits SDK AWS. Si vous avez acheté une capacité provisionnée, toutes les récupérations rapides de type Expedited sont automatiquement transmises par le biais de votre capacité provisionnée.

Capacité provisionnée

La capacité provisionnée vous permet de disposer d'une capacité d'extraction pour les extractions de type Expedited lorsque vous en avez besoin. Chaque unité de capacité permet d'effectuer au moins trois extractions de type Expedited toutes les 5 minutes et offre un débit d'extraction qui peut atteindre 150 mégaoctets par seconde (Mo/s).

Si votre charge de travail nécessite un accès extrêmement fiable et prévisible à un sous-ensemble de vos données en quelques minutes, nous vous recommandons d'acheter de la capacité d'extraction provisionnée. Sans capacité provisionnée, les extractions de type Expedited sont généralement acceptées, sauf dans les rares cas où la demande est particulièrement élevée. Toutefois, si vous avez besoin d'un accès aux récupérations rapides en toutes circonstances, vous devez acheter la capacité de récupération provisionnée.

Achat d'une capacité allouée

Vous pouvez acheter des unités de capacité provisionnée à l'aide de la console S3 Glacier, de l'opération de l'API REST Acheter la capacité provisionnée (POST provisioned-capacity), des kits SDK AWS ou de l'interface AWS CLI. Pour connaître la tarification de la capacité provisionnée, consultez Tarification Amazon S3 Glacier.

Une unité de capacité provisionnée a une durée d'un mois à partir de la date et de l'heure d'achat.

Si la date de début est le 31e jour du mois, la date d'expiration correspond au dernier jour du mois suivant. Par exemple, si la date de début est le 31 août, la date d'expiration est le 30 septembre. Si la date de début est le 31 janvier, la date d'expiration est le 28 février.

Pour acheter de la capacité provisionnée à l'aide de la console Amazon S3 Glacier
  1. Connectez-vous à la AWS Management Console et ouvrez la console S3 Glacier à l'adresse https://console.aws.amazon.com/glacier/home.

  2. Dans le panneau de navigation de gauche, choisissez Paramètres d'extraction de données.

  3. Sous Unités de capacités allouées (PCU), choisissez Acheter la PCU. La boîte de dialogue Acheter la PCU s'affiche.

  4. Si vous souhaitez acheter de la capacité provisionnée, saisissez confirm dans la zone Confirmer l'achat.

  5. Choisissez Acheter la PCU.

Récupération d'une plage d'archives

Lorsque vous extrayez une archive de S3 Glacier, vous pouvez éventuellement spécifier une plage, ou une partie, de l'archive à extraire. Le comportement par défaut consiste à extraire la totalité de l'archive. La spécification d'une plage d'octets peut vous être utile lorsque vous souhaitez effectuer les actions suivantes :

  • Gérer vos téléchargements de données : S3 Glacier permet de télécharger les données extraites pendant 24 heures une fois que la demande d'extraction a été effectuée. Par conséquent, vous souhaiterez peut-être extraire uniquement certaines parties de l'archive afin de pouvoir gérer le programme des téléchargements dans la fenêtre de téléchargement définie.

  • Extraire une partie ciblée d'une archive volumineuse : par exemple, supposez que vous avez regroupé un grand nombre de fichiers, que vous les avez chargés sous la forme d'une archive unique et que vous souhaitez à présent extraire une partie des fichiers. Dans ce cas, vous pouvez spécifier une plage de l'archive qui contient les fichiers qui vous intéressent en utilisant une demande d'extraction. Vous pouvez aussi lancer plusieurs demandes d'extraction, chacune d'elles définissant une plage d'un ou de plusieurs fichiers.

Lors du lancement d'une tâche d'extraction à l'aide d'extractions par plage, vous devez fournir une plage alignée en termes de méga-octet. En d'autres termes, la plage d'octets peut commencer à zéro (début de l'archive) ou à n'importe quel intervalle d'1 Mo suivant (1 Mo, 2 Mo, 3 Mo, etc.).

La fin de la section peut correspondre à la fin de votre archive ou être indiquée, là encore, selon tout intervalle de 1 Mo supérieur à celui de départ. Par ailleurs, si vous souhaitez obtenir des valeurs de total de contrôle lorsque vous téléchargez les données (une fois que la tâche d'extraction est terminée), la plage que vous demandez lors du lancement de la tâche doit également être alignée avec le hachage d'arborescence. Vous pouvez utiliser des totaux de contrôle pour vérifier que les données n'ont pas été endommagées pendant la transmission. Pour plus d'informations sur l'alignement en termes de méga-octets et l'alignement avec le hachage d'arborescence, consultez la section Réception des totaux de contrôle lors du téléchargement de données.