Paso 2: lanzar un clúster de Amazon EMR - Amazon DynamoDB

Paso 2: lanzar un clúster de Amazon EMR

En este paso, configuraremos y lanzaremos un clúster de Amazon EMR. Ya estarán instalados en el clúster tanto Hive como un controlador de almacenamiento para DynamoDB.

  1. Abra la consola de Amazon EMR enhttps://console.aws.amazon.com/emr.

  2. Elija Create Cluster (Crear clúster).

  3. En la página Create Cluster - Quick Options, haga lo siguiente:

    1. En Cluster name, escriba el nombre del clúster (por ejemplo, My EMR cluster).

    2. En EC2 key pair, elija el par de claves que creó anteriormente.

    No cambie los valores predeterminados de los demás ajustes.

  4. Elija Create cluster.

Se tardan unos minutos en lanzar el clúster. Puede utilizar la página Cluster Details (Detalles del clúster) de la consola de Amazon EMR para monitorear el progreso.

Cuando el estado cambia a Waiting, el clúster está preparado para usarlo.

Archivos del registro del clúster y Amazon S3

Un clúster de Amazon EMR genera archivos de registros que contienen información acerca del estado del clúster y sobre depuración. La configuración predeterminada de Create Cluster - Quick Options (Crear un clúster: opciones rápidas) incluye la configuración de registros de Amazon EMR.

Si no hay un bucket de Amazon S3, la AWS Management Console lo crea. El nombre del bucket es aws-logs-account-id-region, donde account-id es el número de su cuenta de AWS y region es la región donde lanzó el clúster (por ejemplo, aws-logs-123456789012-us-west-2).

nota

Puede usar la consola de Amazon S3 para ver los archivos de registro. Para obtener más información, consulte View Log Files (Ver archivos de registros) en la Guía de administración de Amazon EMR.

Puede usar este bucket para otros fines, además de generar registros. Por ejemplo, puede utilizar el bucket como ubicación para almacenar un script de Hive o como destino al exportar datos de Amazon DynamoDB a Amazon S3.

Siguiente paso

Paso 3: conectarse al nodo principal