COPYda formati di dati colonnari - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

COPYda formati di dati colonnari

COPYpuò caricare dati da Amazon S3 nei seguenti formati colonnari:

  • ORC

  • Parquet

Per esempi di utilizzo di formati di COPY dati a colonne, consulta. COPYesempi

COPYsupporta dati in formato colonnare con le seguenti considerazioni:

  • Il bucket Amazon S3 deve trovarsi nella stessa AWS regione del database Amazon Redshift.

  • Per accedere ai dati di Amazon S3 tramite un VPC endpoint, configura l'accesso utilizzando IAM policy e IAM ruoli come descritto in Uso di Amazon Redshift Spectrum with VPC Enhanced Routing nella Amazon Redshift Management Guide.

  • COPYnon applica automaticamente le codifiche di compressione.

  • Sono supportati solo i seguenti COPY parametri:

  • Se si COPY verifica un errore durante il caricamento, il comando fallisce. ACCEPTANYDATEe MAXERROR non sono supportati per i tipi di dati colonnari.

  • I messaggi di errore vengono inviati al SQL client. Alcuni errori vengono registrati in STL _ _ ERRORS e LOAD STL _ERROR.

  • COPYinserisce i valori nelle colonne della tabella di destinazione nello stesso ordine in cui le colonne si trovano nei file di dati colonnari. Il numero di colonne nella tabella di destinazione e il numero di colonne nel file di dati devono corrispondere.

  • Se il file specificato per l'COPYoperazione include una delle seguenti estensioni, decomprimiamo i dati senza la necessità di aggiungere alcun parametro:

    • .gz

    • .snappy

    • .bz2

  • COPYdal Parquet e dai formati di ORC file utilizza Redshift Spectrum e l'accesso al bucket. Per utilizzarli COPY per questi formati, assicurati che non vi siano IAM politiche che blocchino l'uso di Amazon S3 presigned. URLs I URLs prefirmati generati da Amazon Redshift sono validi per 1 ora, in modo che Amazon Redshift abbia abbastanza tempo per caricare tutti i file dal bucket Amazon S3. URLViene generato un predefinito univoco per ogni file scansionato da formati di dati colonnari. COPY Per le policy bucket che includono un's3:signatureAgeazione, assicurati di impostare il valore su almeno 3.600.000 millisecondi. Per ulteriori informazioni, consulta Utilizzo di Amazon Redshift Spectrum con routing VPC avanzato.