Utilizzo di Modifica schema per mappare nuovamente le chiavi delle proprietà dei dati - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di Modifica schema per mappare nuovamente le chiavi delle proprietà dei dati

Una trasformazione Modifica schema mappa nuovamente le chiavi di proprietà dei dati di origine nella configurazione desiderata per i dati di destinazione. In un nodo di trasformazione Modifica schema, puoi:

  • Modificare il nome di più chiavi di proprietà dati.

  • Modificare il tipo di dati delle chiavi di proprietà dei dati, se il nuovo tipo di dati è supportato e esiste un percorso di trasformazione tra i due tipi di dati.

  • Scegliere un sottoinsieme di chiavi di proprietà dei dati indicando quali chiavi di proprietà dei dati si desidera eliminare.

È inoltre possibile aggiungere altri nodi Change Schema al diagramma del lavoro in base alle esigenze, ad esempio per modificare sorgenti dati aggiuntive o dopo una trasformazione Join.

Utilizzo di Change Schema con tipo di dati decimale

Quando si utilizza la trasformazione Change Schema con tipo di dati decimale, la trasformazione Change Schema modifica la precisione portandola al valore predefinito di (10,2). Per modificare questa impostazione e impostare la precisione per il proprio caso d'uso, è possibile utilizzare la trasformazione SQL Query e eseguire il cast delle colonne con una precisione specifica.

Ad esempio, se disponi di una colonna di input denominata DecimalCol "" di tipo Decimal e desideri rimapparla a una colonna di output denominata "OutputDecimalCol" con una precisione specifica di (18,6), dovresti:

  1. Aggiungere una successiva trasformazione di SQL Query dopo la trasformazione Change Schema.

  2. Nella trasformazione SQL Query, usa una query SQL per eseguire il cast della colonna rimappata con la precisione desiderata. La query SQL avrebbe il seguente aspetto:

    SELECT col1, col2, CAST(DecimalCol AS DECIMAL(18,6)) AS OutputDecimalCol FROM __THIS__

    Nella query SQL precedente:

    • `col1` e `col2` sono altre colonne dei dati che vuoi esaminare senza modifiche.

    • `DecimalCol` è il nome della colonna originale ricavato dai dati di input.

    • `CAST (DecimalCol AS DECIMAL (18,6)) `converte il` `in un tipo decimale con una precisione di 18 cifre e 6 cifre decimali. DecimalCol

    • `AS `rinomina la colonna castata in` `. OutputDecimalCol OutputDecimalCol

Utilizzando la trasformazione SQL Query, è possibile sovrascrivere la precisione predefinita impostata dalla trasformazione Change Schema e assegnare esplicitamente alle colonne Decimal la precisione desiderata. Questo approccio consente di sfruttare la trasformazione Change Schema per rinominare e ristrutturare i dati gestendo al contempo i requisiti di precisione per le colonne Decimal attraverso la successiva trasformazione di SQL Query.

Aggiungere una trasformazione Change Schema al tuo lavoro

Nota

La trasformazione Modifica schema non fa distinzione tra maiuscole e minuscole.

Aggiunta di un nodo di trasformazione Modifica schema al diagramma di processo
  1. (Facoltativo) Apri il pannello Risorse, quindi scegli Modifica schema per aggiungere una nuova trasformazione al diagramma di processo, se necessario.

  2. Nel pannello Proprietà del nodo, inserisci un nome per il nodo nel diagramma del processo. Se non è già selezionato un nodo padre, scegli un nodo dall'elenco Node parents (Nodi padre) da utilizzare come origine di input per la trasformazione.

  3. Seleziona la scheda Trasforma nel pannello Proprietà del nodo.

  4. Modifica lo schema di input:

    • Per rinominare una chiave di proprietà dati, inserisci il nuovo nome della chiave nel campo Target key (Chiave di destinazione).

    • Per modificare il tipo di dati per una chiave di proprietà dei dati, scegli il nuovo tipo di dati per la chiave dall'elenco Data type (Tipo di dati).

    • Per rimuovere una chiave di proprietà dati dallo schema di destinazione, scegli la casella di controllo Drop (Elimina) per quella chiave.

  5. (Facoltativo) Dopo aver configurato le proprietà del nodo di trasformazione, puoi visualizzare lo schema modificato per i dati scegliendo la scheda Output schema (Schema di output) nel pannello dei dettagli del nodo. La prima volta che si sceglie questa scheda per qualsiasi nodo del processo, viene richiesto di fornire un ruolo IAM per accedere ai dati. Se non è stato specificato un ruolo IAM nella scheda Job details (Dettagli del processo), viene richiesto di immettere un ruolo IAM a questo punto.

  6. (Facoltativo) Dopo aver configurato le proprietà del nodo e le proprietà di trasformazione, puoi visualizzare il set di dati modificato scegliendo la scheda Data preview (Anteprima dei dati) nel pannello dei dettagli del nodo. La prima volta che si sceglie questa scheda per qualsiasi nodo del processo, viene richiesto di fornire un ruolo IAM per accedere ai dati. Esiste un costo per l'utilizzo di questa caratteristica e la fatturazione inizia non appena si fornisce un ruolo IAM.