Nomeando buckets do S3 em suas camadas de dados - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Nomeando buckets do S3 em suas camadas de dados

As Funções a seguir fornecem Funções de nomenclatura para buckets do Amazon Simple Storage Service (Amazon S3) em camadas do bucket ets do Amazon Simple Storage Service (Amazon S3) em camadas de data lake. No entanto, você pode personalizar os nomes do bucket e do caminho do S3 de acordo com os requisitos da sua organização. Recomendamos que você crie buckets S3 separados para cada camada individual, pois os requisitos de arquivamento, controle de versão, acesso e criptografia podem variar para cada camada.

O diagrama a seguir mostra a estrutura de nomenclatura recomendada para buckets do S3 nas três camadas de data lake recomendadas, incluindo a separação de várias unidades de negócios, formatos de arquivo e partições. Você pode adaptar as partições de dados de acordo com os requisitos da sua organização, mas deve usar pares de letras minúsculas e de valores-chave (por exemployear=yyyy, nãoyyyy) para poder atualizar o catálogo com oMSCK REPAIR TABLE comando.

A abordagem de nomenclatura varia para buckets do S3 de acordo com a camada de dados para a qual eles se destinam.
Importante

Os buckets do S3 devem seguir as diretrizes de nomenclatura das regras de nomenclatura de buckets na documentação do Amazon S3.