Registrazione di uno schema in AWS Glue - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Registrazione di uno schema in AWS Glue

Dopo che lo sviluppatore di AWS Glue ha codificato il progetto e caricato un archivio in formato ZIP su Amazon Simple Storage Service (Amazon S3), un amministratore di AWS Glue dovrà registrarlo. La registrazione del piano lo rende disponibile per l'uso.

Quando si registra un progetto, AWS Glue ne copia l'archivio in una posizione Amazon S3 riservata. È quindi possibile eliminare l'archivio dalla posizione di caricamento.

Per registrare un piano, hai bisogno delle autorizzazioni di lettura per la posizione Amazon S3 che contiene l'archivio caricato. È inoltre necessario disporre dell'autorizzazione AWS Identity and Access Management (IAM) glue:CreateBlueprint. Per le autorizzazioni suggerite da concedere a un amministratore di AWS Glue che deve registrare, visualizzare e gestire i progetti, consulta Autorizzazioni per i progetti per l'amministratore di AWS Glue per gli schemi.

Puoi registrare un progetto utilizzando la console AWS Glue, l'API AWS Glue o la AWS Command Line Interface (AWS CLI).

Per registrare un piano (console)
  1. Accertati di disporre delle autorizzazioni di lettura (s3:GetObject) per l'archivio ZIP del piano in Amazon S3.

  2. Apri la console AWS Glue all'indirizzo https://console.aws.amazon.com/glue/.

    Accedi come un utente che dispone delle autorizzazioni per registrare un piano. Passa alla stessa regione AWS del bucket Amazon S3 che contiene l'archivio ZIP del piano.

  3. Nel pannello di navigazione seleziona schemi. Quindi, nella pagina schemi, seleziona Add blueprint (aggiungi schema).

  4. Immetti un nome e, facoltativamente, una descrizione.

  5. Per ZIP archive location (S3) (Posizione archivio ZIP [S3]), inserisci il percorso Amazon S3 dell'archivio ZIP del piano caricato. Includi il nome del file di archivio nel percorso e inizia il percorso con s3://.

  6. (Facoltativo) Aggiungi uno o più tag.

  7. Scegli Add blueprint (Aggiungi piano).

    La pagina schemi restituisce e mostra che lo stato del piano è CREATING. Seleziona il pulsante di aggiornamento fino a quando lo stato non cambia in ACTIVE o FAILED.

  8. Se lo stato è FAILED, seleziona il piano e nella scheda Actions (Operazioni), scegli View (Visualizza).

    La pagina dei dettagli mostra il motivo dell'errore. Se il messaggio dell'errore indica che è impossibile accedere all'oggetto nella posizione... o che è negato l'accesso sull'oggetto nella posizione..., verifica i requisiti seguenti:

    • L'utente con cui hai effettuato l'accesso deve disporre dell'autorizzazione di lettura per l'archivio ZIP del piano in Amazon S3.

    • Il bucket Amazon S3 che contiene l'archivio ZIP deve disporre di una policy di bucket che conceda l'autorizzazione di lettura sull'oggetto al tuo ID account AWS. Per ulteriori informazioni, consulta Sviluppo di schemi in AWS Glue.

    • Il bucket Amazon S3 che stai utilizzando deve trovarsi nella stessa regione di quella alla quale hai eseguito l'accesso sulla console.

  9. Assicurati che gli analisti dei dati dispongano delle autorizzazioni per il piano.

    La policy IAM suggerita per gli analisti di dati è mostrata in Autorizzazioni per gli schemi per l'analista dati. Questa policy concede glue:GetBlueprint su qualsiasi risorsa. Se i criteri sono più granulari a livello di risorsa, concedi agli analisti di dati le autorizzazioni per questa risorsa appena creata.

Per registrare un piano (AWS CLI)
  1. Inserisci il comando seguente.

    aws glue create-blueprint --name <blueprint-name> [--description <description>] --blueprint-location s3://<s3-path>/<archive-filename>
  2. Immetti il seguente comando per verificare lo stato del piano. Ripeti il comando fino a quando lo stato non diventa ACTIVE o FAILED.

    aws glue get-blueprint --name <blueprint-name>

    Se lo stato è FAILED e il messaggio dell'errore indica che è impossibile accedere all'oggetto nella posizione... o che è negato l'accesso sull'oggetto nella posizione..., verifica i requisiti seguenti:

    • L'utente con cui hai effettuato l'accesso deve disporre dell'autorizzazione di lettura per l'archivio ZIP del piano in Amazon S3.

    • Il bucket Amazon S3 che contiene l'archivio ZIP deve disporre di una policy di bucket che conceda l'autorizzazione di lettura sull'oggetto al tuo ID account AWS. Per ulteriori informazioni, consulta Pubblicazione di uno schema.

    • Il bucket Amazon S3 che stai utilizzando deve trovarsi nella stessa regione di quella alla quale hai eseguito l'accesso sulla console.