Como os links de recursos funcionam no Lake Formation - AWS Lake Formation

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como os links de recursos funcionam no Lake Formation

Um link de recurso é um objeto do catálogo de dados que é um link para um banco de dados, ou uma tabela local, ou compartilhada. Depois de criar um link de recurso para um banco de dados ou tabela, você pode usar o nome do link de recurso onde quer que use o nome do banco de dados ou da tabela. Juntamente com as tabelas que você possui ou que são compartilhadas com você, os links de recursos de tabela são retornados pelo glue:GetTables() e aparecem como entradas na página Tabelas do console do Lake Formation. Os links de recursos para bancos de dados agem de maneira semelhante.

A criação de um link de recurso para um banco de dados ou tabela permite que você:

  • Atribua um nome diferente a um banco de dados ou tabela em seu catálogo de dados. Isso é especialmente útil se AWS contas diferentes compartilharem bancos de dados ou tabelas com o mesmo nome, ou se vários bancos de dados em sua conta tiverem tabelas com o mesmo nome.

  • Acesse os bancos de dados e tabelas do Catálogo de Dados de qualquer AWS região criando links de recursos nessas regiões apontando para o banco de dados e tabelas em outra região. Você pode executar consultas em qualquer região com esses links de recursos usando Athena, EMR Amazon e AWS Glue ETL executar trabalhos do Spark, sem copiar os dados de origem nem os metadados no Glue Data Catalog.

  • Use AWS serviços integrados, como Amazon Athena o Amazon Redshift Spectrum, para executar consultas que acessam bancos de dados ou tabelas compartilhados. Alguns serviços integrados não podem acessar diretamente bancos de dados ou tabelas entre contas. No entanto, eles podem acessar links de recursos em sua conta para bancos de dados e tabelas em outras contas.

nota

Você não precisa criar um link de recurso para fazer referência a um banco de dados ou tabela compartilhado no AWS Glue scripts de extração, transformação e carregamento (ETL). No entanto, para evitar ambiguidades quando várias AWS contas compartilham um banco de dados ou tabela com o mesmo nome, você pode criar e usar um link de recurso ou especificar a ID do catálogo ao invocar operaçõesETL.

O exemplo a seguir mostra a página Tabelas do console Lake Formation, que lista dois links de recursos. Os nomes dos links de recursos são sempre exibidos em itálico. Cada link de recurso é exibido junto com o nome e o proprietário do recurso compartilhado vinculado. Neste exemplo, um administrador de data lake na AWS conta 1111-2222-3333 compartilhou as tabelas inventory e incidents com a conta 1234-5678-9012. Em seguida, um usuário dessa conta criou links de recursos para essas tabelas compartilhadas.

A página Tabelas mostra dois links de recursos. O nome do link do recurso é mostrado na coluna Nome, o nome da tabela compartilhada é mostrado na coluna Recurso compartilhado e a conta que compartilhou a tabela é mostrada na coluna Proprietário do recurso compartilhado.

A seguir estão notas e restrições sobre links de recursos:

  • Os links de recursos são necessários para permitir que serviços integrados, como Athena e Redshift Spectrum, consultem os dados subjacentes das tabelas compartilhadas. As consultas nesses serviços integrados são construídas com base nos nomes dos links de recursos.

  • Supondo que a configuração Usar somente controle de IAM acesso para novas tabelas nesse banco de dados esteja desativada para o banco de dados que o contém, somente o principal que criou um link de recurso pode visualizá-lo e acessá-lo. Para permitir que outras entidades principais da sua conta acessem um link de recurso, conceda a permissão DESCRIBE nela. Para permitir que outras pessoas descartem um link de recurso, conceda a permissão DROP para ele. Os administradores do data lake podem acessar todos os links de recursos na conta. Para descartar um link de recurso criado por outra entidade principal, o administrador do data lake deve primeiro conceder a si a permissão DROP no link do recurso. Para obter mais informações, consulte Referência de permissões do Lake Formation.

    Importante

    Conceder permissões em um link de recurso não concede permissões no banco de dados ou tabela de destino (vinculado). Você deve conceder permissões no destino separadamente.

  • Para criar um link de recurso, você precisa da CREATE_DATABASE permissão CREATE_TABLE ou do Lake Formation, bem como da permissão glue:CreateTable ou glue:CreateDatabase AWS Identity and Access Management (IAM).

  • Você pode criar links de recursos para recursos locais (próprios) do Catálogo de Dados, bem como para recursos compartilhados com sua AWS conta.

  • Quando você cria um link de recurso, nenhuma verificação é executada para ver se o recurso compartilhado de destino existe ou se você tem permissões entre contas no recurso. Isso permite que você crie o link do recurso e o recurso compartilhado em qualquer ordem.

  • Se você excluir um link de recurso, o recurso compartilhado vinculado não será descartado. Se você descartar um recurso compartilhado, os links de recursos para esse recurso não serão excluídos.

  • É possível criar cadeias de links de recursos. No entanto, não há valor em fazer isso, pois APIs segue apenas o primeiro link do recurso.