Registrar um esquema no AWS Glue - AWS Glue

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Registrar um esquema no AWS Glue

Após o desenvolvedor do AWS Glue codificar o esquema e carregar um arquivo ZIP no Amazon Simple Storage Service (Amazon S3), um administrador do AWS Glue deve registrar o esquema. Registrar o blueprint o torna disponível para uso.

Quando você registra um esquema, o AWS Glue copia o arquivo de esquema para um local reservado do Amazon S3. Em seguida, você pode excluir o arquivo do local de onde foi carregado.

Para registrar um blueprint, você precisa de permissões de leitura no local do Amazon S3 que contém o arquivo carregado. Você também precisa da permissão do AWS Identity and Access Management (IAM) glue:CreateBlueprint. Para obter as permissões sugeridas para um administrador do AWS Glue que deve registrar, visualizar e manter esquemas, consulte Permissões de administrador do AWS Glue para esquemas.

Você pode registrar um esquema usando o console do AWS Glue, a API do AWS Glue ou a AWS Command Line Interface (AWS CLI).

Para registrar um blueprint (console)
  1. Verifique se você tem permissões de leitura (s3:GetObject) no arquivo ZIP de blueprint no Amazon S3.

  2. Abra o console do AWS Glue em https://console.aws.amazon.com/glue/.

    Faça login como um usuário que tem permissões para registrar um blueprint. Mude para a mesma região da AWS do bucket do Amazon S3 que contém o arquivo ZIP de esquema.

  3. No painel de navegação, escolha Blueprints (Esquemas). Em seguida, na página Blueprints (Esquemas), escolha Add blueprint (Adicionar esquema).

  4. Insira um nome de blueprint e uma descrição opcional.

  5. Para o local do arquivo ZIP (S3), insira o caminho do Amazon S3 do arquivo ZIP de blueprint carregado. Inclua o nome do arquivo no caminho e o inicie com s3://.

  6. (Opcional) adicione uma ou mais tags.

  7. Escolha Add blueprint (Adicionar blueprint).

    A página Blueprints (Esquemas) retorna e mostra que o status do esquema é CREATING. Escolha o botão de atualização até que o status mude para ACTIVE ou FAILED.

  8. Se o status for FAILED, selecione o blueprint e, no menu Actions (Ações), escolha View (Exibir).

    A página de detalhes mostra o motivo da falha. Se a mensagem do erro for “Unable to access object at location…” (Não foi possível acessar o objeto no local…) ou “Access denied on object at location…” (Acesso negado no objeto no local…), analise os seguintes requisitos:

    • O usuário ao qual você está conectado deve ter permissão de leitura no arquivo ZIP de blueprint no Amazon S3.

    • O bucket do Amazon S3 que contém o arquivo ZIP deve ter uma política de bucket que conceda permissão de leitura no objeto ao seu ID da conta da AWS. Para ter mais informações, consulte Desenvolver esquemas no AWS Glue.

    • O bucket do Amazon S3 que você está usando deve estar na mesma região em que você se conectou no console.

  9. Certifique-se de que os analistas de dados tenham permissões no blueprint.

    A política do IAM sugerida para analistas de dados é mostrada em Permissões de analista de dados para esquemas. Essa política concede glue:GetBlueprint em qualquer recurso. Se sua política for mais minuciosa no nível do recurso, conceda permissões aos analistas de dados nesse recurso recém-criado.

Para registrar um blueprint (AWS CLI)
  1. Insira o comando a seguir.

    aws glue create-blueprint --name <blueprint-name> [--description <description>] --blueprint-location s3://<s3-path>/<archive-filename>
  2. Para verificar o status do blueprint, insira o comando a seguir. Repita o comando até que o status vá para ACTIVE ou FAILED.

    aws glue get-blueprint --name <blueprint-name>

    Se o status for FAILED e a mensagem de erro for “Unable to access object at location…” (Não foi possível acessar o objeto no local…) ou “Access denied on object at location…” (Acesso negado no objeto no local…), analise os seguintes requisitos:

    • O usuário ao qual você está conectado deve ter permissão de leitura no arquivo ZIP de blueprint no Amazon S3.

    • O bucket do Amazon S3 que contém o arquivo ZIP deve ter uma política de bucket que conceda permissão de leitura no objeto ao seu ID da conta da AWS. Para ter mais informações, consulte Publicar um esquema.

    • O bucket do Amazon S3 que você está usando deve estar na mesma região em que você se conectou no console.