Acessar tabelas entre regiões - AWS Lake Formation

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Acessar tabelas entre regiões

O Lake Formation suporta a consulta de tabelas do Catálogo de Dados em todas as AWS regiões. Você pode acessar dados em uma região de outras regiões usando o Amazon Athena, o Amazon EMR e o AWS Glue ETL criando links de recursos em outras regiões apontando para os bancos de dados e tabelas de origem. Com o acesso à tabela entre regiões, você pode acessar dados entre regiões sem copiar os dados subjacentes ou os metadados no catálogo de dados.

Por exemplo, você pode compartilhar um banco de dados ou uma tabela em uma conta de produtor com uma conta de consumidor na Região A. Após aceitar o convite de compartilhamento de recursos na Região A, o administrador do data lake da conta do consumidor pode criar links de recursos para o recurso compartilhado na Região B. O administrador da conta do consumidor pode conceder permissões sobre o recurso compartilhado com as entidades principais do IAM nessa conta na Região A, e conceder permissões de link de recurso na Região B. Ao usar o link do recurso, as entidades principais da conta do consumidor podem consultar os dados compartilhados da Região B.

Você também ser host da fonte de dados do Amazon S3 na Região A em uma conta de produtor, e registrar o local dos dados em uma conta central na Região B. Você pode criar recursos do catálogo de dados na conta central, configurar permissões do Lake Formation, e compartilhar dados com consumidores em sua conta ou com contas externas na Região B. O atributo entre regiões permite que os usuários acessem essas tabelas do catálogo de dados da Região C usando links de recursos.

Ao usar esse atributo, você pode consultar bancos de dados federados em Apache Hive repositórios entre regiões e também unir tabelas na região local com tabelas em outra região ao executar consultas.

O Lake Formation oferece suporte aos seguintes recursos com acesso a tabelas entre regiões:

  • Controle de acesso baseado em tags do LF

  • Permissões de acesso refinado

  • Operações de gravação no banco de dados compartilhado ou na tabela com as permissões apropriadas

  • Compartilhamento de dados entre contas no nível da conta e direto com as entidades principais do IAM

Usuários não administrativos com permissões Create_Database e permissões Create_Table podem criar links de recursos entre regiões.

nota

Você pode criar links de recursos entre regiões em qualquer região e acessar dados sem aplicar as permissões do Lake Formation. Para dados de origem no Amazon S3 que não estão registrados no Lake Formation, o acesso é determinado pelas políticas de permissões do IAM para o Amazon AWS Glue S3 e pelas ações.

Para conhecer as limitações, consulte Limitações de acesso aos dados entre regiões.

Fluxos de trabalho

Os diagramas a seguir mostram os fluxos de trabalho para acessar dados entre AWS regiões a partir da mesma AWS conta e de uma conta externa.

Fluxo de trabalho para acessar tabelas compartilhadas na mesma AWS conta

No diagrama abaixo, os dados são compartilhados com um usuário na mesma AWS conta na região Leste dos EUA (Norte da Virgínia), e o usuário consulta os dados compartilhados da região Europa (Irlanda).

Diagram showing data sharing between Contas da AWS across regions with numbered steps.

O administrador do data lake executa as seguintes atividades (etapas 1 e 2):

  1. Um administrador de data lake configura uma AWS conta com os bancos de dados e tabelas do Catálogo de Dados e registra uma localização de dados do Amazon S3 no Lake Formation na região Leste dos EUA (Norte da Virgínia).

    Conceder a permissão Select em um recurso do catálogo de dados (tabela de produtos no diagrama) a uma entidade principal (usuário) na mesma conta.

  2. Cria um link de recurso na região da Europa (Irlanda) apontando para a tabela de origem na região Leste dos EUA (Norte da Virgínia). Conceder a permissão DESCRIBE no link do recurso da região da Europa (Irlanda) à entidade principal.

  3. O usuário consulta a tabela da região da Europa (Irlanda) usando Athena.

Fluxo de trabalho para acessar tabelas compartilhadas com uma AWS conta externa

No diagrama abaixo, a conta do produtor (Conta A) hospeda o bucket Amazon S3, registra o local dos dados e compartilha uma tabela do catálogo de dados com uma conta de consumidor (Conta B) na região Leste dos EUA (Norte da Virgínia) e um usuário da conta do consumidor (Conta B) consulta a tabela da região Europa (Irlanda).

Diagram showing data sharing between Contas da AWS across regions using Amazon S3 and Data Catalog.
  1. Um administrador do data lake configura uma AWS conta (conta do produtor) com os recursos do catálogo de dados e um local de dados do Amazon S3 registrado no Lake Formation na região Leste dos EUA (Norte da Virgínia).

  2. O administrador do data lake da conta do produtor compartilha uma tabela do catálogo de dados com uma conta de consumidor.

  3. O administrador do data lake da conta do consumidor aceita o convite de compartilhamento de dados na região Leste dos EUA (Norte da Virgínia) e concede a permissão Select na tabela compartilhada a uma entidade principal da mesma região.

  4. O administrador do data lake da conta do consumidor cria um link de recurso na região da Europa (Irlanda) apontando para a tabela compartilhada de destino na região Leste dos EUA (Norte da Virgínia) e concede ao usuário a permissão DESCRIBE no link do recurso da região Europa (Irlanda).

  5. O usuário consulta os dados da região da Europa (Irlanda) usando o Athena.