Tutorial: Caricamento dei dati da Amazon S3 - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tutorial: Caricamento dei dati da Amazon S3

Questo tutorial guida attraverso l'intero processo di caricamento di dati nelle tabelle di database Amazon Redshift a partire dai file di dati in un bucket Amazon S3.

In questo tutorial, esegui quanto indicato di seguito:

  • Scarichi file di dati che utilizzano formati CSV, delimitati da caratteri e a larghezza fissa.

  • Creare un bucket Amazon S3 e quindi caricare i file di dati nel bucket.

  • Avviare un cluster Amazon Redshift e creare le tabelle di database.

  • Utilizzare i comandi COPY per caricare le tabelle dai file di dati su Amazon S3.

  • Risolvere gli errori di caricamento e modificare i comandi COPY per correggere gli errori.

Tempo previsto: 60 minuti

Costo previsto: 1,00 USD/ora per il cluster

Prerequisiti

Sono necessari i seguenti prerequisiti:

  • Un AWS account per avviare un cluster Amazon Redshift e creare un bucket in Amazon S3.

  • AWS Le tue credenziali (ruolo IAM) per caricare i dati di test da Amazon S3. Se hai bisogno di un nuovo ruolo IAM, vai a Creazione di ruoli IAM.

  • Un client SQL, ad esempio l'editor di query della console Amazon Redshift.

Questo tutorial è stato concepito in modo da essere svolto indipendentemente dagli altri. Oltre a questo tutorial, consigliamo di seguire i tutorial seguenti per avere una migliore comprensione del modo in cui progettare e utilizzare database Amazon Redshift.

Panoramica

È possibile aggiungere dati alle tabelle Amazon Redshift utilizzando un comando INSERT o COPY. Alla scala e alla velocità di un data warehouse Amazon Redshift, il comando COPY risulta molto più veloce ed efficace dei comandi INSERT.

Il comando COPY utilizza l'architettura MPP (Massively Parallel Processing) di Amazon Redshift per leggere e caricare dati in parallelo da più origini dati. È possibile caricare i file di dati su Amazon S3, Amazon EMR o qualsiasi host remoto accessibile mediante una connessione Secure Shell (SSH). In alternativa, è possibile caricare direttamente da una tabella Amazon DynamoDB.

In questo tutorial, sarà utilizzato il comando COPY per caricare dati da Amazon S3. Molti dei principi presentati qui sono validi anche per il caricamento da altre origini dati.

Per ulteriori informazioni sull'utilizzo del comando COPY, consultare le seguenti risorse:

Fasi