Come funzionano i link alle risorse in Lake Formation - AWS Lake Formation

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Come funzionano i link alle risorse in Lake Formation

Un collegamento a una risorsa è un oggetto del catalogo dati che è un collegamento a un database o a una tabella locale o condivisa. Dopo aver creato un link di risorsa a un database o a una tabella, è possibile utilizzare il nome del link di risorsa ovunque si utilizzi il nome del database o della tabella. Oltre alle tabelle di tua proprietà o alle tabelle condivise con te, i link alle risorse delle tabelle vengono restituiti glue:GetTables() e vengono visualizzati come voci nella pagina Tabelle della console Lake Formation. I collegamenti alle risorse ai database agiscono in modo simile.

La creazione di un collegamento di risorsa a un database o a una tabella consente di effettuare le seguenti operazioni:

  • Assegna un nome diverso a un database o a una tabella nel tuo Data Catalog. Ciò è particolarmente utile se AWS account diversi condividono database o tabelle con lo stesso nome o se più database dell'account hanno tabelle con lo stesso nome.

  • Accedi ai database e alle tabelle del Data Catalog da qualsiasi AWS regione creando collegamenti alle risorse in quelle aree che puntano al database e alle tabelle in un'altra regione. Puoi eseguire query in qualsiasi regione con questi link alle risorse utilizzando Athena, Amazon EMR ed AWS Glue eseguire job ETL Spark, senza copiare i dati di origine né i metadati in Glue Data Catalog.

  • Utilizza AWS servizi integrati come Amazon Athena Amazon Redshift Spectrum per eseguire query che accedono a database o tabelle condivisi. Alcuni servizi integrati non possono accedere direttamente a database o tabelle tra account. Tuttavia, possono accedere ai link delle risorse presenti nel tuo account ai database e alle tabelle di altri account.

Nota

Non è necessario creare un collegamento a una risorsa per fare riferimento a un database o a una tabella condivisa negli script di AWS Glue estrazione, trasformazione e caricamento (ETL). Tuttavia, per evitare ambiguità quando più AWS account condividono un database o una tabella con lo stesso nome, è possibile creare e utilizzare un collegamento alla risorsa o specificare l'ID del catalogo quando si richiamano le operazioni ETL.

L'esempio seguente mostra la pagina Tabelle della console di Lake Formation, che elenca due collegamenti a risorse. I nomi dei link alle risorse sono sempre visualizzati in corsivo. Ogni collegamento alla risorsa viene visualizzato insieme al nome e al proprietario della risorsa condivisa collegata. In questo esempio, un amministratore di Data Lake nell' AWS account 1111-2222-3333 ha condiviso le incidents tabelle inventory and con l'account 1234-5678-9012. Un utente di quell'account ha quindi creato collegamenti alle risorse a tali tabelle condivise.

La pagina Tabelle mostra due link alle risorse. Il nome del link alle risorse viene visualizzato nella colonna Nome, il nome della tabella condivisa nella colonna Risorsa condivisa e l'account che ha condiviso la tabella nella colonna Proprietario della risorsa condivisa.

Di seguito sono riportate le note e le restrizioni relative ai collegamenti alle risorse:

  • I link alle risorse sono necessari per consentire a servizi integrati come Athena e Redshift Spectrum di interrogare i dati sottostanti delle tabelle condivise. Le query in questi servizi integrati sono costruite sulla base dei nomi dei link alle risorse.

  • Supponendo che l'impostazione Usa solo il controllo di accesso IAM per le nuove tabelle in questo database sia disattivata per il database che lo contiene, solo il principale che ha creato un collegamento alla risorsa può visualizzarlo e accedervi. Per consentire agli altri responsabili del tuo account di accedere a un link a una risorsa, concedi l'DESCRIBEautorizzazione. Per consentire ad altri di eliminare un link a una risorsa, concedi l'DROPautorizzazione. Gli amministratori di Data Lake possono accedere a tutti i link alle risorse presenti nell'account. Per eliminare un collegamento a una risorsa creato da un altro principale, l'amministratore del data lake deve prima concedersi l'DROPautorizzazione sul collegamento alla risorsa. Per ulteriori informazioni, consulta Riferimento alle autorizzazioni di Lake Formation.

    Importante

    La concessione delle autorizzazioni su un collegamento a una risorsa non concede le autorizzazioni sul database o sulla tabella di destinazione (collegati). È necessario concedere le autorizzazioni sulla destinazione separatamente.

  • Per creare un collegamento a una risorsa, è necessaria l'CREATE_DATABASEautorizzazione CREATE_TABLE o la Lake Formation, nonché l'autorizzazione glue:CreateTable or glue:CreateDatabase AWS Identity and Access Management (IAM).

  • Puoi creare collegamenti a risorse locali (di proprietà) del Data Catalog, nonché a risorse condivise con il tuo AWS account.

  • Quando crei un link a una risorsa, non viene eseguito alcun controllo per verificare se la risorsa condivisa di destinazione esiste o se disponi di autorizzazioni per più account sulla risorsa. Ciò consente di creare il collegamento alla risorsa e la risorsa condivisa in qualsiasi ordine.

  • Se si elimina un collegamento a una risorsa, la risorsa condivisa collegata non viene eliminata. Se si elimina una risorsa condivisa, i link delle risorse a tale risorsa non vengono eliminati.

  • È possibile creare catene di collegamenti di risorse. Tuttavia, non è utile farlo, perché le API seguono solo il primo collegamento alla risorsa.