Recuperando arquivos do S3 Glacier usando o console AWS - Amazon S3 Glacier

Se você é novato no Amazon Simple Storage Service (Amazon S3), recomendamos que comece aprendendo mais sobre as classes de armazenamento S3 Glacier no Amazon S3, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive. Para obter mais informações, consulte Classes de armazenamento S3 Glacier e Classes de armazenamento para arquivamento de objetos no Guia do usuário do Amazon S3.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Recuperando arquivos do S3 Glacier usando o console AWS

Recuperar um arquivo do Amazon S3 Glacier é uma operação assíncrona na qual você primeiro inicia um trabalho e, em seguida, faz download da saída depois de concluí-lo. Para iniciar um trabalho de recuperação de arquivo, você deve usar Initiate Job (trabalhos POST) API REST ou equivalente na AWS CLI, ou AWS SDKs.

Recuperar um arquivo do S3 Glacier é um processo de duas etapas.

Para recuperar um arquivo
  1. Inicie um trabalho de recuperação de arquivo.

    1. Obtenha o ID do arquivo que você deseja recuperar. Você pode obter o ID de arquivo de um inventário de cofre. Você pode obter o ID do arquivo com a API REST, AWS CLI ou AWS SDKs. Para obter mais informações, consulte Fazer download de um inventário de vault no Amazon S3 Glacier.

    2. Inicie um trabalho solicitando que o S3 Glacier prepare um arquivo inteiro ou uma parte dele para download subsequente usando a operação Initiate Job (trabalhos POST).

    Quando você inicia um trabalho, o S3 Glacier cria um ID de trabalho na resposta e o executa de maneira assíncrona. (Você não poderá fazer download da saída do trabalho depois da conclusão desse trabalho conforme descrito na Etapa 2.)

    Importante

    Somente para recuperações padrão, uma política de recuperação de dados pode causar uma falha na solicitação Initiate Job do trabalho de recuperação de inicialização com uma exceção PolicyEnforcedException . Para obter mais informações sobre políticas de recuperação de dados, consulte Políticas de recuperação de dados do S3 Glacier. Para obter mais informações sobre a exceção PolicyEnforcedException, consulte Respostas de erro.

    Quando necessário, é possível restaurar grandes segmentos dos dados armazenados no S3 Glacier. Para obter informações sobre as Classes de armazenamento S3 Glacier, consulte Classes de armazenamento de objetos no Guia do Desenvolvedor do Amazon Simple Storage Service.

  2. Após a conclusão do trabalho, faça download dos bytes usando a operação Get Job Output (GET output).

    Você pode fazer download de todos os bytes ou especificar um intervalo de bytes para fazer download somente de uma parte da saída do trabalho. Para uma saída maior, fazer download da saída em blocos ajudará se houver uma falha no download, como uma falha de rede. Se obtiver a saída do trabalho em uma única solicitação e houver uma falha na rede, você precisará reiniciar o download da saída desde o início. No entanto, se fizer download da saída em blocos, em caso de alguma falha, você precisará somente reiniciar o download da parte menor, e não de toda a saída.

O S3 Glacier deve concluir o trabalho para você obter o resultado. Após a conclusão, um trabalho não vai expirar por pelo menos 24 horas, o que significa que você pode fazer download da saída dentro do período de 24 horas depois do término do trabalho. Para determinar se o trabalho está concluído, verifique o status usando uma das seguintes opções:

  • Aguardar a notificação de conclusão do trabalho : Você pode especificar um tópico do Amazon Simple Notification Service (Amazon SNS) no qual o S3 Glacier poderá publicar uma notificação depois que o trabalho for concluído. O S3 Glacier enviará uma notificação somente depois de concluir o trabalho.

    Você pode especificar um tópico do Amazon SNS para um trabalho ao iniciá-lo. Além de especificar um tópico do Amazon SNS na solicitação de trabalho, se o cofre tiver uma configuração de notificação definida para eventos de recuperação do arquivo, o S3 Glacier também publicará uma notificação para esse tópico do SNS. Para obter mais informações, consulte Configurar notificações de cofre no Amazon S3 Glacier.

  • Solicitar informações do trabalho explicitamente : Você também pode usar a operação da Describe Job API S3 Glacier (Trabalho de descrição (GET JobID)) para pesquisar periodicamente informações do trabalho. No entanto, recomendamos usar as notificações do Amazon SNS.

nota

As informações obtidas por você usando a notificação do Amazon SNS são as mesmas recebidas quando se chama Describe Job a operação API.

Opções de recuperação de arquivos

Você pode especificar um dos seguintes ao iniciar um trabalho para recuperar um arquivo com base nos requisitos de tempo e custo de acesso. Para obter informações sobre preços de recuperação, consulte Preços do Amazon S3 Glacier.

  • Expedited : As recuperações expressas permitem que você acesse rapidamente os dados armazenados na classe de armazenamento S3 Glacier Flexible Retrieval ou no nível S3 Intelligent-Tiering Archive Access quando solicitações urgentes ocasionais para restauração de arquivos são necessárias. Exceto para os arquivos maiores (mais de 250 MB), os dados acessados usando-se recuperações expressas costumam ser disponibilizados dentro de 1 a 5 minutos. A capacidade provisionada garante que sua capacidade de recuperação para recuperações expressas esteja disponível quando você precisar dela. Para obter mais informações, consulte Capacidade provisionada.

  • Padrão : As recuperações padrão permitem acessar qualquer um dos arquivos em várias horas. As recuperações padrão normalmente são concluídas dentro de 3 a 5 horas. Padrão é a opção assumida para solicitações de recuperação que não especificam a opção de recuperação.

  • Bulk : As recuperações em massa são a opção de recuperação de menor custo do S3 Glacier que você pode usar para recuperar grandes quantidades de dados, até mesmo petabytes, em um dia. As recuperações em massa (Bulk retrievals) normalmente são concluídas dentro de 5 a 12 horas.

A tabela a seguir resume as opções de recuperação de arquivos. Para obter mais informações sobre preços, consulte Preços do Amazon S3 Glacier.

Serviço Expressa Padrão Em massa

Amazon S3 Glacier

1 a 5 minutos

3 a 5 horas

5 a 12 horas

Para fazer uma recuperação de Expedited, Standard ou Bulk, defina o elemento Tier da solicitação na solicitação da operação de API REST de RestoreObject que você deseja, ou o equivalente na AWS Command Line Interface (AWS CLI) ou em AWS SDKs. Se você adquiriu a capacidade provisionada, todas as recuperações expressas serão automaticamente fornecidas por meio de sua capacidade provisionada.

Capacidade provisionada

A capacidade provisionada ajuda a garantir que sua capacidade de recuperação para recuperações expressas esteja disponível quando você precisar dela. Cada unidade de capacidade garante que pelo menos três recuperações expressas possam ser realizadas a cada cinco minutos e fornece até 150 megabytes por segundo (MB/s) de throughput de recuperação.

Se sua workload exigir acesso altamente confiável e previsível a um subconjunto de seus dados em minutos, será necessário adquirir a capacidade de recuperação provisionada. Sem capacidade provisionada, as recuperações expressas são normalmente aceitas, exceto em raras situações de demanda excepcionalmente alta. Contudo, se precisar de acesso a recuperações expressas em todas as circunstâncias, você deve comprar a capacidade de recuperação provisionada.

Comprar capacidade provisionada

Você pode comprar unidades de capacidade provisionada usando o console Purchase Provisioned Capacity (POST provisioned-capacity) Operação API REST, os AWS SDKs, ou AWS CLI. Para obter informações sobre a definição de preços da capacidade provisionada, consulte Definição de preços do Amazon S3.

Uma unidade de capacidade provisionada dura um mês a partir da data e hora da compra.

Se a data de início é dia 31 de um mês, a data de expiração será o último dia do mês seguinte. Por exemplo, se a data de início é dia 31 de agosto, a data de expiração será dia 30 de setembro. Se a data de início é dia 31 de janeiro, a data de expiração será dia 28 de fevereiro.

Para comprar capacidade provisionada usando o console Amazon S3 Glacier
  1. Faça login em AWS Management Console e abra o console do S3 Glacier em https://console.aws.amazon.com/mobileanalytics/home.

  2. No painel de navegação à esquerda, escolha Configurações de recuperação de dados.

  3. Em Unidades de capacidade provisionada (PCUs), escolha Comprar PCU. A caixa de diálogo Comprar PCU é exibida.

  4. Se quiser comprar capacidade provisionada, entre confirm na caixa Para confirmar a compra.

  5. Escolha Comprar PCU.

Recuperações de arquivo no intervalo

Ao recuperar um arquivo do S3 Glacier, você pode especificar um intervalo, ou mesmo um segmento, do arquivo a ser recuperado. O padrão é recuperar o arquivo todo. Especificar um intervalo de bytes pode ser útil quando você deseja fazer o seguinte:

  • Gerenciar os downloads de dados: O S3 Glacier permite que os dados recuperados sejam baixados por 24 horas após a conclusão da solicitação de recuperação. Portanto, convém recuperar somente partes do arquivo, de maneira que você possa gerenciar a programação de downloads dentro da janela de download indicada.

  • Recuperar uma parte segmentada de um arquivo grande: Por exemplo, suponhamos que você tenha agregado muitos arquivos anteriormente e feito upload deles como um único arquivo e agora queira recuperar alguns deles. Nesse caso, pode-se especificar um intervalo do arquivo que contenha os arquivos que lhe interessam usando uma solicitação de recuperação. Ou você pode iniciar várias solicitações de recuperação, cada uma com um intervalo para um ou mais arquivos.

Ao iniciar um trabalho de recuperação usando recuperações de intervalo, você deve fornecer um intervalo alinhado a megabytes. Em outras palavras, o intervalo de bytes pode começar em zero (o início do arquivo) ou em qualquer intervalo de 1 MB posterior (1 MB, 2 MB, 3 MB e assim por diante).

O final do intervalo pode ser o final do arquivo ou qualquer intervalo de 1 MB maior que o início do intervalo. Além disso, se você quiser obter valores da soma de verificação ao fazer download dos dados (depois da conclusão do trabalho de recuperação), o intervalo solicitado por você na iniciação do trabalho também deverá estar alinhado ao tree-hash. Somas de verificação são uma maneira de você garantir que os dados não tenham sido corrompidos durante a transmissão. Para obter mais informações sobre os alinhamentos a megabytes e ao hash de árvore, consulte Receber somas de verificação durante o download de dados.