Abilitazione della compattazione - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Abilitazione della compattazione

Puoi utilizzare la console, AWS Glue la console di Lake Formation o AWS API abilitare la compattazione per le tue tabelle Apache Iceberg nel AWS Glue Data Catalog. AWS CLI Per le nuove tabelle, puoi scegliere Apache Iceberg come formato di tabella e abilitare la compattazione quando crei la tabella. La compattazione è disabilitata per impostazione predefinita per le nuove tabelle.

Console
Per abilitare la compattazione
  1. Apri la AWS Glue console all'indirizzo https://console.aws.amazon.com/glue/e accedi come amministratore del data lake, creatore della tabella o utente a cui sono state concesse lakeformation:GetDataAccess le autorizzazioni glue:UpdateTable e sulla tabella.

  2. Nel pannello di navigazione, in Catalogo dati, seleziona Tabelle.

  3. Nella pagina Tabelle, scegli una tabella in formato tabella aperta per la quale desideri abilitare la compattazione, quindi nel menu Azioni, scegli Abilita compattazione.

  4. Puoi anche abilitare la compattazione selezionando la tabella e aprendo la pagina dei Dettagli della tabella. Scegli la scheda Ottimizzazione della tabella nella sezione inferiore della pagina e scegli Abilita compattazione.

  5. Nella pagina Abilita la compattazione, scegli un IAMruolo dal menu a discesa per eseguire la compattazione.

    Il IAM ruolo deve avere le autorizzazioni mostrate nella sezione. Prerequisiti per l'ottimizzazione delle tabelle

    Puoi anche scegliere l'opzione Crea un nuovo IAM ruolo per creare un ruolo personalizzato con le autorizzazioni necessarie per eseguire la compattazione.

    Segui i passaggi seguenti per aggiornare un ruolo esistenteIAM:

    1. Per aggiornare la politica delle autorizzazioni per il IAM ruolo, nella IAM console, vai al IAM ruolo utilizzato per eseguire la compattazione.

    2. Nella sezione Autorizzazioni, scegli Aggiungi policy bucket. Nella finestra del browser appena aperta, crea una nuova policy da utilizzare con il tuo ruolo.

    3. Nella pagina Crea policy, scegli la JSON scheda. Copia il JSON codice mostrato nel campo Prerequisiti nel campo dell'editor delle politiche.

  6. Scegli Invia.

AWS CLI

L'esempio seguente mostra come abilitare la compattazione. Sostituisci l'ID dell'account con un ID AWS account valido. Sostituisci il nome del database e della tabella con quello effettivo della tabella Iceberg e del database. Sostituisci il roleArn con il nome della AWS risorsa (ARN) del IAM ruolo e il nome del IAM ruolo che dispone delle autorizzazioni necessarie per eseguire la compattazione.

aws glue create-table-optimizer \ --catalog-id 123456789012 \ --database-name iceberg_db \ --table-name iceberg_table \ --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role", "enabled":'true'}' \ --type compaction
AWS API

Chiama l'operazione CreateTableOptimizer per abilitare la compattazione di una tabella.

Dopo aver abilitato la compattazione, la scheda di Ottimizzazione della tabella mostra i seguenti dettagli di compattazione, dopo circa 15-20 minuti:

Ora di inizio

L'ora in cui è iniziato il processo di compattazione in Data Catalog. Il valore è un timestamp nel tempo. UTC

Ora di fine

L'ora in cui il processo di compattazione è terminato in Data Catalog. Il valore è un timestamp nel tempo. UTC

Stato

Lo stato della corsa di compattazione. I valori sono esito positivo o negativo.

File compattati

Numero totale di file compattati.

Byte compattati

Numero totale di byte compattati.