Fase 2: Creare un EMR cluster Amazon - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Fase 2: Creare un EMR cluster Amazon

Il COPY comando carica i dati dai file su Amazon EMR Hadoop Distributed File System ()HDFS. Quando crei il EMR cluster Amazon, configura il cluster per inviare file di dati al clusterHDFS.

Per creare un EMR cluster Amazon
  1. Crea un EMR cluster Amazon nella stessa AWS regione del cluster Amazon Redshift.

    Se il cluster Amazon Redshift si trova in unVPC, il EMR cluster Amazon deve appartenere allo stesso VPC gruppo. Se il cluster Amazon Redshift utilizza la modalità EC2 -Classic (ovvero non si trova in unaVPC), il EMR cluster Amazon deve utilizzare EC2 anche la modalità -Classic. Per ulteriori informazioni, consulta Managing Clusters in Virtual Private Cloud (VPC) nella Amazon Redshift Management Guide.

  2. Configura il cluster per inviare file di dati al cluster. HDFS I nomi dei HDFS file non devono includere asterischi (*) o punti interrogativi (?).

    Importante

    I nomi dei file non devono contenere asterischi (*) o punti interrogativi (?).

  3. Specificare No per l'opzione Auto-terminate nella configurazione del EMR cluster Amazon in modo che il cluster rimanga disponibile durante l'esecuzione del COPY comando.

    Importante

    Se uno qualsiasi dei file di dati viene modificato o eliminato prima del COPY completamento, è possibile che si ottengano risultati imprevisti o che l'COPYoperazione non riesca.

  4. Annota l'ID del cluster e il pubblico principale DNS (l'endpoint per l'EC2istanza Amazon che ospita il cluster). Queste informazioni saranno utili per le fasi successive.