Agregar pasos a un clúster con la consola de administración de Amazon EMR - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Agregar pasos a un clúster con la consola de administración de Amazon EMR

Utilice los siguientes procedimientos para agregar pasos a un clúster con la AWS Management Console. Para obtener información detallada sobre cómo enviar los pasos de aplicaciones de macrodatos específicas, consulte las siguientes secciones de la guía de versiones de Amazon EMR:

Agregar pasos durante la creación del clúster

Desde allí AWS Management Console, puede añadir pasos al crear un clúster.

nota

Hemos rediseñado la consola de Amazon EMR para que sea más fácil de utilizar. Consulte Consola Amazon EMR para obtener información sobre las diferencias entre la consola antigua y la nueva.

New console
Para agregar pasos al crear un clúster con la nueva consola
  1. Inicie sesión en la AWS Management Console consola Amazon EMR y ábrala en https://console.aws.amazon.com/emr.

  2. En EMR en EC2 situado en el panel de navegación izquierdo, elija Clústeres y, a continuación, elija Crear clúster.

  3. En Pasos, seleccione Agregar paso. Escriba los valores adecuados en los campos del cuadro de diálogo Agregar paso. Para obtener información sobre cómo dar formato a los argumentos de los pasos, consulte Agregar argumentos de paso. Las opciones varían según el tipo de paso. Para agregar el paso y salir del cuadro de diálogo, seleccione Agregar paso.

  4. Elija cualquier otra opción que se aplique a su clúster.

  5. Para lanzar el clúster, elija Crear clúster.

Old console
Para agregar pasos al crear un clúster con la consola antigua
  1. Abra la consola Amazon EMR en https://console.aws.amazon.com/elasticmapreduce/home. Seleccione Crear clúster: opciones avanzadas.

  2. En la página Step 1: Software and Steps (Paso 1: Software y pasos), en Steps (optional) (Pasos (opcional)), seleccione Run multiple steps in parallel to improve cluster utilization and save cost (Ejecutar varios pasos en paralelo para mejorar la utilización del clúster y ahorrar costos). El valor predeterminado para el nivel de simultaneidad es 10. Puede elegir entre 2 y 256 pasos que se pueden ejecutar en paralelo.

    nota

    La ejecución de varios pasos en paralelo solo es compatible con las versiones 5.28.0 y posteriores de Amazon EMR.

  3. En After last step completes (Después de completar el último paso), elija Cluster enters waiting state (El cluster entra en estado de espera) o Auto-terminate the cluster (Terminar automáticamente el clúster).

  4. Elija Step type (Tipo de paso) y, a continuación, Add step (Añadir paso).

  5. Escriba los valores adecuados en los campos del cuadro de diálogo Add Step (Añadir paso). Para obtener información sobre cómo dar formato a los argumentos de los pasos, consulte Agregar argumentos de paso. Las opciones varían según el tipo de paso. Si ha habilitado Ejecutar varios pasos en paralelo para mejorar la utilización del clúster y ahorrar costos, la única opción disponible para Acción en caso de error es Continuar. A continuación, elija Add (Añadir).

Agregar pasos a un clúster en ejecución

Con el AWS Management Console, puede añadir pasos a un clúster con la opción de finalización automática desactivada.

New console
Para agregar pasos a un clúster en ejecución con la nueva consola
  1. Inicie sesión en la AWS Management Console consola Amazon EMR y ábrala en https://console.aws.amazon.com/emr.

  2. En EMR en EC2, en el panel de navegación izquierdo, elija Clústeres y seleccione el clúster que desee actualizar.

  3. En la página Pasos de la página de detalles del clúster, seleccione Agregar paso. Para clonar un paso existente, seleccione el menú desplegable Acciones y seleccione Clonar paso.

  4. Escriba los valores adecuados en los campos del cuadro de diálogo Agregar paso. Las opciones varían según el tipo de paso. Para agregar el paso y salir del cuadro de diálogo, elija Agregar paso.

Old console
Para agregar pasos a un clúster en ejecución con la consola antigua
  1. Abra la consola Amazon EMR en https://console.aws.amazon.com/elasticmapreduce/home. En la página Cluster List (Lista de clústeres), seleccione el enlace para el clúster.

  2. En la página Cluster Details (Detalles del clúster), seleccione la pestaña Steps (Pasos).

  3. En la pestaña Steps (Pasos) elija Add step (Añadir paso).

  4. Escriba los valores adecuados en los campos del cuadro de diálogo Add Step (Añadir paso) y, a continuación, elija Add (Añadir). Las opciones varían según el tipo de paso.

Modificar el nivel de simultaneidad de pasos en un clúster en ejecución

Con el AWS Management Console, puede modificar el nivel de simultaneidad de los pasos en un clúster en ejecución.

nota

Solo puede ejecutar varios pasos en paralelo con las versiones 5.28.0 y posteriores de Amazon EMR.

New console
Para modificar la simultaneidad de pasos en un clúster en ejecución con la nueva consola
  1. Inicie sesión en la AWS Management Console consola Amazon EMR y ábrala en https://console.aws.amazon.com/emr.

  2. En EMR en EC2, en el panel de navegación izquierdo, elija Clústeres y seleccione el clúster que desee actualizar. El clúster debe estar en ejecución para cambiar su atributo de simultaneidad.

  3. En la pestaña Pasos de la página de detalles del clúster, busque la sección Atributos. Seleccione Editar para cambiar la simultaneidad. Escriba un valor comprendido entre 1 y 256.

Old console
Para modificar la simultaneidad de pasos en un clúster en ejecución con la consola antigua
  1. Abra la consola Amazon EMR en https://console.aws.amazon.com/elasticmapreduce/home. En la página Cluster List (Lista de clústeres), seleccione el enlace para el clúster.

  2. En la página Cluster Details (Detalles del clúster), seleccione la pestaña Steps (Pasos).

  3. En Concurrency (Simultaneidad), elija Change (Cambiar). Seleccione un nuevo valor para el nivel de simultaneidad de pasos y, a continuación, guarde el cambio.

Agregar argumentos de paso

Si utiliza el AWS Management Console para añadir un paso a su clúster, puede especificar los argumentos para ese paso en el campo Argumentos. Debe separar los argumentos con espacios en blanco y rodear los argumentos de cadena que constan de caracteres y espacios en blanco con comillas.

ejemplo : argumentos correctos

Los argumentos del ejemplo siguiente tienen el formato correcto para el argumento de cadena final AWS Management Console, con comillas.

bash -c "aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh ."

También puede colocar cada argumento en una línea independiente para facilitar la lectura, como se muestra en el siguiente ejemplo.

bash -c "aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh ."
ejemplo : argumentos incorrectos

Los siguientes argumentos de ejemplo tienen un formato incorrecto para la AWS Management Console. Observe que el último argumento de cadena, aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh ., contiene espacios en blanco y no está entre comillas.

bash -c aws s3 cp s3://DOC-EXAMPLE-BUCKET/my-script.sh .