Enviar trabajo a un clúster - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Enviar trabajo a un clúster

En esta sección se describen los métodos que puedes usar para enviar trabajos a un EMR clúster de Amazon. Para enviar el trabajo, puede agregar pasos o enviar los trabajos de Hadoop de forma interactiva al nodo principal.

Tenga en cuenta las siguientes reglas de comportamiento de los pasos al enviar los pasos a un clúster:

  • El ID de paso puede contener un máximo de 256 caracteres.

  • Puedes tener un máximo de 256 PENDING RUNNING pasos en un clúster.

  • Incluso si tiene 256 pasos activos en ejecución en el clúster, puede enviar trabajos de forma interactiva al nodo principal. Puede enviar un número ilimitado de pasos a lo largo de la vida útil de un clúster de larga ejecución, pero solo se pueden enviar 256 pasos RUNNING o PENDING en un momento dado.

  • Con EMR las versiones 4.8.0 y posteriores de Amazon, excepto la versión 5.0.0, puedes cancelar los pasos pendientes. Para obtener más información, consulte Cancelar pasos.

  • Con EMR las versiones 5.28.0 y posteriores de Amazon, puedes cancelar los pasos pendientes y en ejecución. También puede optar por ejecutar varios pasos en paralelo para mejorar la utilización del clúster y ahorrar costos. Para obtener más información, consulte Consideraciones para ejecutar varios pasos en paralelo.

nota

Para obtener el mejor rendimiento, le recomendamos que almacene las acciones de arranque, los scripts y otros archivos personalizados que desee utilizar con Amazon EMR en un bucket de Amazon S3 que se encuentre en el mismo Región de AWS como su clúster.