Caricamento dei dati - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Caricamento dei dati

Il modo più efficiente per caricare una tabella è il comando COPY. Inoltre, è possibile aggiungere dati alle tabelle usando i comandi INSERT, sebbene sia molto meno efficiente rispetto all'utilizzo di COPY. Il comando COPY è in grado di leggere da più file di dati o più flussi di dati contemporaneamente. Amazon Redshift assegna il carico di lavoro ai nodi del cluster ed esegue le operazioni di caricamento in parallelo, incluso l'ordinamento delle righe e la distribuzione dei dati tra le sezioni dei nodi.

Nota

Le tabelle esterne di Amazon Redshift Spectrum sono di sola lettura. Non puoi utilizzare COPY o INSERT in una tabella esterna.

Per accedere ai dati su altre AWS risorse, il cluster deve disporre dell'autorizzazione ad accedere a tali risorse e ad eseguire le azioni necessarie per accedere ai dati. È possibile utilizzare AWS Identity and Access Management (IAM) per limitare l'accesso degli utenti alle risorse e ai dati del cluster.

Dopo il caricamento iniziale dei dati, se aggiungi, modifichi o elimini una grande quantità di dati, devi eseguire il follow-up tramite un comando VACUUM per riorganizzare i dati e recuperare spazio dopo le eliminazioni. Devi anche eseguire un comando ANALYZE per aggiornare le statistiche della tabella.

Questa sezione descrive come caricare i dati e risolvere i problemi relativi ai caricamenti dei dati e presenta le best practice per il caricamento dei dati.