Recuperación de archivos de S3 Glacier mediante la consola de AWS - Amazon S3 Glacier

Esta página es solo para los clientes actuales del servicio S3 Glacier que utilizan Vaults y el original de 2012. REST API

Si busca soluciones de almacenamiento de archivos, le sugerimos que utilice las clases de almacenamiento S3 Glacier en Amazon S3, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive. Para obtener más información sobre estas opciones de almacenamiento, consulte Clases de almacenamiento de S3 Glacier y Almacenamiento de datos a largo plazo con clases de almacenamiento de S3 Glacier en la Guía del usuario de Amazon S3. Estas clases de almacenamiento utilizan Amazon S3API, están disponibles en todas las regiones y se pueden gestionar en la consola de Amazon S3. Ofrecen funciones como el análisis de costos de almacenamiento, Storage Lens, funciones avanzadas de cifrado opcionales y más.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Recuperación de archivos de S3 Glacier mediante la consola de AWS

La recuperación de un archivo de Amazon S3 Glacier es una operación asíncrona, en la que primero debe iniciar un trabajo y, después, descargar la salida una vez completado el trabajo. Para iniciar un trabajo de recuperación de un archivo, utilice la operación de la API de REST Iniciar trabajo (POSTtrabajos) o el equivalente en la AWS CLI, o bien los SDK de AWS.

El proceso de recuperación de un archivo de S3 Glacier consta de dos pasos.

Para recuperar un archivo
  1. Se inicia un trabajo de recuperación de archivo.

    1. Obtenga el ID del archivo que desea recuperar. Puede obtener el ID de archivo de un inventario del almacén. Puede obtener el ID del archivo con la API de REST, la AWS CLI o los SDK de AWS. Para obtener más información, consulte Descarga de un inventario de almacén en Amazon S3 Glacier.

    2. Inicie un trabajo que solicite a S3 Glacier que prepare todo un archivo o una parte de este para su posterior descarga mediante la operación Iniciar trabajo (POSTtrabajos).

    Cuando inicia un trabajo, S3 Glacier devuelve un ID de trabajo en la respuesta y ejecuta el trabajo de forma asíncrona. (No puede descargar la salida de trabajo hasta que este se complete, tal como se describe en el paso 2).

    importante

    En el caso de las recuperaciones estándar únicamente, una política de recuperación de datos puede hacer que se produzca una excepción PolicyEnforcedException en la solicitud Initiate Job. Para obtener más información sobre las políticas de recuperación de datos, consulte Políticas de recuperación de datos de S3 Glacier. Para obtener más información sobre la excepción PolicyEnforcedException, consulte Respuestas de error.

    Cuando sea necesario, puede restaurar grandes segmentos de los datos almacenados en S3 Glacier. Para obtener información sobre cómo restaurar datos de las clases de almacenamiento de S3 Glacier, consulte Clases de almacenamiento para el archivado de objetos en la Guía del usuario de Amazon Simple Storage Service.

  2. Una vez completado el trabajo, descargue los bytes mediante la operación Obtención de la salida del trabajo (GET output).

    Puede descargar todos los bytes o especificar un rango de bytes para descargar solo una parte de la salida del trabajo. En el caso de las salidas más grandes, la descarga de la salida en fragmentos es de ayuda si se produce un error en la descarga, como un error de red. Si obtiene la salida de trabajo en una única solicitud y hay un error de red, tendrá que reiniciar la descarga de la salida desde el principio. Sin embargo, si descargar la salida en fragmentos, en caso de error, solo necesitará reiniciar la descarga de la parte más pequeña y no de toda la salida.

S3 Glacier debe completar un trabajo antes de poder obtener su salida. Tras completarse, un trabajo no caduca durante al menos 24 horas, por lo que puede descargar la salida en el periodo de 24 horas después de haberse completado el trabajo. Para determinar si el trabajo se ha completado, compruebe su estado con una de las opciones siguientes:

  • Esperar una notificación de finalización del trabajo: puede especificar un tema de Amazon Simple Notification Service (Amazon SNS) en el que S3 Glacier puede publicar una notificación cuando se complete el trabajo. S3 Glacier envía la notificación únicamente después de haberse completado el trabajo.

    Puede especificar un tema de Amazon SNS para un trabajo cuando lo inicie. Además de especificar un tema de Amazon SNS en su solicitud de trabajo, si su almacén tiene establecida la configuración de notificaciones para los eventos de recuperación de archivo, S3 Glacier también publica una notificación en ese tema de SNS. Para obtener más información, consulte Configuración de las notificaciones de almacén en Amazon S3 Glacier.

  • Solicitar explícitamente información del trabajo: también puede usar la operación de la API Describe Job de S3 Glacier (Descripción del trabajo (GET JobID)) con el fin de sondear información sobre el trabajo de forma periódica. No obstante, le recomendamos que utilice las notificaciones de Amazon SNS.

nota

La información que se obtiene mediante las notificaciones de Amazon SNS es la misma que se obtiene al llamar a la operación de la API Describe Job.

Opciones de recuperación de archivos

Al iniciar un trabajo para recuperar un archivo, puede especificar una de las siguientes opciones de recuperación en función de los requisitos de tiempo y costos de acceso. Para obtener información acerca de los precios de recuperación, consulte Precios de Amazon S3 Glacier.

  • Acelerada: las recuperaciones rápidas permiten acceder de forma rápida a los datos guardados en la clase de almacenamiento de S3 Glacier Flexible Retrieval o en el nivel de acceso a archivos de S3 de Agrupación por niveles inteligente cuando se requieran solicitudes urgentes ocasionales para restaurar archivos. En todos los casos, excepto en los archivos de mayor tamaño (más de 250 MB), los datos a los que se accede mediante las recuperaciones rápidas suelen estar disponibles en un plazo de entre 1 y 5 minutos. La capacidad aprovisionada garantiza que la capacidad que necesitan las recuperaciones Expedited estará disponible cuando lo necesite. Para obtener más información, consulte Capacidad aprovisionada.

  • Estándar: las recuperaciones estándar le permiten acceder a cualquiera de sus archivos en un plazo de varias horas. Las recuperaciones estándar suelen completarse en un plazo de entre 3 y 5 horas. Estándar es la opción predeterminada para las solicitudes de recuperación que no especifican la opción de recuperación.

  • En bloque: las recuperaciones en bloque son la opción de recuperación de S3 Glacier de menor costo, que puede usar para recuperar grandes cantidades de datos, incluso petabytes, de forma económica y en un mismo día. Las recuperaciones en bloque suelen completarse en un plazo de entre 5 y 12 horas.

En la tabla siguiente se resumen las opciones de recuperación de archivos. Para obtener información sobre precios, consulte Precios de Amazon S3 Glacier.

Servicio Rápida Estándar En bloque

Amazon S3 Glacier

Entre 1 y 5 minutos

Entre tres y cinco horas

Entre cinco y 12 horas

Para realizar una recuperación ExpeditedStandard o Bulk, establezca el elemento de solicitud Tier en la solicitud de operación de la API de REST RestoreObject en la opción que desee, o el equivalente en la AWS Command Line Interface (AWS CLI) o los SDK de AWS. Si ha adquirido capacidad aprovisionada, todas las recuperaciones rápidas se realizarán automáticamente con su capacidad aprovisionada.

Capacidad aprovisionada

La capacidad aprovisionada garantiza que la capacidad de recuperación para las recuperaciones rápidas esté disponible cuando la necesite. Cada unidad de capacidad permite que se puedan realizar al menos tres recuperaciones rápidas cada 5 minutos y proporciona hasta 150 megabytes por segundo (MBps) de rendimiento de recuperación.

Si su carga de trabajo requiere un acceso de confianza y predecible a un subconjunto de sus datos en cuestión de minutos, se recomienda que adquiera capacidad de recuperación aprovisionada. Sin la capacidad aprovisionada, las solicitudes de recuperación rápida se suelen aceptar, salvo en situaciones extraordinarias en las que la demanda sea inusualmente alta. Sin embargo, si necesita obtener acceso a recuperaciones rápidas incondicionalmente, deberá adquirir capacidad de recuperación aprovisionada.

Compra de capacidad aprovisionada

Puede comprar unidades de capacidad aprovisionada mediante la consola de S3 Glacier, la operación de la API de REST Adquisición de capacidad aprovisionada (POST capacidad-aprovisionada), los SDK de AWS o la AWS CLI. Para obtener información acerca de los precios de la capacidad aprovisionada, consulte Precios de Amazon S3 Glacier.

Una unidad de capacidad aprovisionada dura un mes a partir de la fecha y la hora de la compra.

Si la fecha de inicio es el 31 de un mes, la fecha de vencimiento es el último día del mes siguiente. Por ejemplo, si la fecha de inicio es 31 de agosto, la fecha de vencimiento es 30 de septiembre. Por ejemplo, si la fecha de inicio es 31 de enero, la fecha de vencimiento es 28 de febrero.

Para comprar capacidad aprovisionada mediante la consola de Amazon S3 Glacier
  1. Inicie sesión en la AWS Management Console y abra la consola de S3 Glacier en https://console.aws.amazon.com/glacier/home.

  2. En el panel de navegación izquierdo, elija Configuración de recuperación de datos.

  3. En Unidades de capacidad aprovisionada (PCU), elija Comprar PCU. Aparece el cuadro de diálogo Comprar PCU.

  4. Si quiere adquirir capacidad aprovisionada, especifique confirm en el cuadro Confirmar compra.

  5. Elija Comprar PCU.

Recuperaciones de archivo por rangos

Cuando recupera un archivo de S3 Glacier, puede especificar un rango del archivo que se va a recuperar, o una parte de este, si así lo desea. El valor predeterminado es recuperar el archivo completo. La especificación de un rango de bytes puede ser útil si desea hacer lo siguiente:

  • Administrar las descargas de datos: S3 Glacier permite que los datos se descarguen hasta 24 horas después de que se haya completado la solicitud de recuperación. Por lo tanto, puede recuperar solo partes del archivo para que pueda administrar la programación de descargas en el intervalo de descarga indicado.

  • Recuperar una parte determinada de un archivo grande: por ejemplo, suponga que ha agregado anteriormente muchos archivos y los ha cargado como uno solo y ahora quiere recuperar algunos de los archivos. En este caso, puede especificar un rango del archivo que contiene aquellos que le interesan mediante una solicitud de recuperación. O bien, puede iniciar varias solicitudes de recuperación, cada una con un rango de uno o más archivos.

Al iniciar un trabajo de recuperaciones por rangos, debe proporcionar un rango esté alineado en megabytes. En otras palabras, el rango de bytes puede comenzar en cero (el principio del archivo) o en cualquier intervalo de 1 MB (1 MB, 2 MB, 3 MB y así sucesivamente) en adelante.

El final del rango puede ser el final del archivo o cualquier intervalo de 1 MB mayor que el principio del rango. Además, si quiere obtener los valores de suma de comprobación al descargar los datos (una vez completado el trabajo de recuperación), el rango que solicite en el inicio del trabajo también debe estar alineado con un hash en árbol. Puede usar sumas de comprobación para asegurarse de que los datos no han resultado dañados durante la transmisión. Para obtener más información sobre la alineación en megabytes y en hash en árbol, consulte Recuperación de sumas de comprobación al descargar datos.