COPY da formati di dati a colonna

COPY può caricare i dati da Amazon S3 nei seguenti formati di colonna:

ORC
Parquet

Per esempi di utilizzo di COPY con formati di dati colonnari, consulta Esempi di COPY.

COPY supporta dati in formato colonnare con le seguenti considerazioni:

Il bucket Amazon S3 deve trovarsi nella stessa AWS regione del database Amazon Redshift.
Per accedere ai dati Amazon S3 tramite un endpoint VPC, configurare l'accesso utilizzando le policy e i ruoli IAM come descritto in Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato nella Guida alla gestione di Amazon Redshift.
COPY non applica automaticamente le codifiche di compressione.
Sono supportati solo i seguenti parametri COPY:
- ACCEPTINVCHARS durante la copia da un file ORC o Parquet.
- FILLRECORD
- FROM
- IAM_ROLE
- CREDENTIALS
- STATUPDATE
- MANIFEST
- EXPLICIT_IDS
Se COPY rileva un errore durante il caricamento, il comando fallisce. ACCEPTANYDATE e MAXERROR non sono supportati per i tipi di dati colonnari..
I messaggi di errore vengono inviati al client SQL. Alcuni errori vengono registrati in STL_LOAD_ERRORS e STL_ERROR.
COPY inserisce i valori nelle colonne della tabella di destinazione nello stesso ordine in cui si presentano le colonne nei file di dati a colonna. Il numero di colonne nella tabella di destinazione e il numero di colonne nel file di dati devono corrispondere.
Se il file specificato per l'operazione COPY include una delle seguenti estensioni, decomprimiamo i dati senza la necessità di aggiungere alcun parametro:
- .gz
- .snappy
- .bz2
Il COPY dai formati di file Parquet e ORC utilizza Redshift Spectrum e l'accesso al bucket. Per utilizzare COPY per questi formati, assicurati che non vi siano policy IAM che blocchino l'uso di Amazon S3 presigned. URLs I URLs prefirmati generati da Amazon Redshift sono validi per 1 ora, in modo che Amazon Redshift abbia abbastanza tempo per caricare tutti i file dal bucket Amazon S3. Viene generato un URL predefinito univoco per ogni file scansionato da COPY da formati di dati colonnari. Per le policy bucket che includono un's3:signatureAgeazione, assicurati di impostare il valore su almeno 3.600.000 millisecondi. Per ulteriori informazioni, consultare Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato.
Il parametro REGION non è supportato con COPY dai formati di dati colonnari. Anche se il bucket Amazon S3 e il database si trovano nello stesso database, è possibile che si verifichi un errore Regione AWS, ad esempio, l'argomento REGION non è supportato per COPY basato su PARQUET.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

COPY da JSON

Stringhe DATEFORMAT e TIMEFORMAT