Operazioni di caricamento dati - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Operazioni di caricamento dati

Gestisce il comportamento predefinito dell'operazione di caricamento per la risoluzione dei problemi o per ridurre i tempi di caricamento specificando i seguenti parametri.

Parametri
COMPROWS numrows

Specifica il numero di righe da utilizzare come dimensione del campione per l'analisi della compressione. L'analisi viene eseguita su righe da ciascuna sezione di dati. Ad esempio, se specifichi COMPROWS 1000000 (1,000,000) e il sistema contiene quattro sezioni totali, vengono lette e analizzate non più di 250.000 righe per ogni sezione.

Se COMPROWS non è specificato, la dimensione del campione è impostata su 100.000 per ogni sezione. I valori di COMPROWS inferiori al valore predefinito di 100.000 righe per ogni sezione vengono automaticamente aggiornati al valore predefinito. Tuttavia, la compressione automatica non verrà eseguita se la quantità di dati caricati è insufficiente per produrre un campione significativo.

Se il numero di COMPROWS è maggiore del numero di righe del file di input, il comando COPY continua ad eseguire l'analisi di compressione su tutte le righe disponibili. L'intervallo accettato per questo argomento è un numero compreso tra 1000 e 2147483647 (2.147.483.647).

COMPUPDATE [ PRESET | { ON | TRUE } | { OFF | FALSE } ]

Controlla se le codifiche di compressione vengono applicate automaticamente durante un COPY.

Quando COMPUPDATE è PRESET, il comando COPY sceglie la codifica di compressione per ogni colonna se la tabella di destinazione è vuota; anche se le colonne hanno già codifiche diverse da RAW. Le codifiche di colonna specificate attualmente possono essere sostituite. La codifica per ogni colonna si basa sul tipo di dati della colonna. Nessun dato viene campionato. Amazon Redshift assegna automaticamente la codifica della compressione come segue:

  • Le colonne definite come chiavi di ordinamento vengono assegnate alla compressione RAW.

  • Le colonne definite come tipi di dati BOOLEAN, REAL o DOUBLE PRECISION vengono assegnate alla compressione RAW.

  • Le colonne definite come SMALLINT, INTEGER, BIGINT, DECIMAL, DATE, TIMESTAMP o TIMESTAMPTZ sono assegnate alla compressione AZ64.

  • Le colonne definite come CHAR o VARCHAR sono assegnate alla compressione LZO.

Quando COMPUPDATE viene omesso, il comando COPY sceglie la codifica di compressione per ciascuna colonna solo se la tabella di destinazione è vuota e non è stata specificata una codifica (diversa da RAW) per nessuna colonna. La codifica per ciascuna colonna è determinata da Amazon Redshift. Nessun dato viene campionato.

Quando COMPUPDATE è impostato su ON (o TRUE) o COMPUPDATE viene specificato senza un'opzione, il comando COPY applica la compressione automatica se la tabella è vuota, anche se le colonne della tabella possiedono già codifiche diverse da RAW. Le codifiche di colonna specificate attualmente possono essere sostituite. La codifica di ciascuna colonna è basata su un'analisi dei dati campione. Per ulteriori informazioni, consulta Caricamento di tabelle con compressione automatica.

Con COMPUPDATE è impostato su OFF (o FALSE), la compressione automatica è disabilitata. Le codifiche di colonna non vengono modificate.

Per informazioni sulla tabella di sistema per analizzare la compressione, consultare STL_ANALYZE_COMPRESSION.

IGNOREALLERRORS

Puoi specificare questa opzione per ignorare tutti gli errori che si verificano durante l'operazione di caricamento.

Non è possibile specificare l'opzione IGNOREALLERRORS se si specifica l'opzione MAXERROR. Non è possibile specificare l'opzione IGNOREALLERRORS per i formati in colonna tra cui ORC e Parquet.

MAXERROR [AS] error_count

Se il caricamento restituisce il error_count numero di errori o superiore, il caricamento fallisce. Se il caricamento restituisce meno errori, continua e restituisce un messaggio INFO che indica il numero di righe che non è stato possibile caricare. Utilizza questo parametro per permettere la prosecuzione del caricamento quando alcune righe non vengono caricate nella tabella a causa di errori di formattazione o altre incongruenze nei dati.

Imposta questo valore su 0 o 1 se desideri che il caricamento fallisca non appena si verifica il primo errore. La parola chiave AS è facoltativa. Il valore predefinito per MAXERROR è 0 e il limite è 100000.

Il numero effettivo di errori segnalati potrebbe essere maggiore del MAXERROR specificato a causa della natura parallela di Amazon Redshift. Se un nodo qualsiasi nel cluster Amazon Redshift rileva che MAXERROR è stato superato, ogni nodo riporta tutti gli errori incontrati.

NOLOAD

Controlla la validità del file di dati senza caricare effettivamente i dati. Utilizza il parametro NOLOAD per assicurarti che il file di dati venga caricato senza errori prima di eseguire il caricamento effettivo dei dati. Eseguire COPY con il parametro NOLOAD è molto più veloce che caricare i dati, perché analizza solo i file.

STATUPDATE [ { ON | TRUE } | { OFF | FALSE } ]

Regola il calcolo automatico e l'aggiornamento delle statistiche dell'ottimizzatore al termine di un comando COPY che ha avuto successo. Per impostazione predefinita, se il parametro STATUPDATE non viene utilizzato, le statistiche vengono aggiornate automaticamente se la tabella è inizialmente vuota.

Ogni volta che l'inserimento di dati in una tabella non vuota modifica significativamente le dimensioni della tabella, consigliamo di aggiornare le statistiche eseguendo un comando ANALYZE o utilizzando l'argomento STATUPDATE ON.

Con STATUPDATE ON (o TRUE), le statistiche vengono aggiornate automaticamente indipendentemente dal fatto che la tabella sia inizialmente vuota. Se si utilizza STATUPDATE, l'utente corrente deve essere il proprietario della tabella o un utente con privilegi avanzati. Se STATUPDATE non è specificato, è richiesta solo l'autorizzazione di INSERT.

Con STATUPDATE OFF (o FALSE), le statistiche non vengono mai aggiornate.

Per ulteriori informazioni, consultare Analisi delle tabelle.