Registros de salida de la consola EC2 - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Registros de salida de la consola EC2

Cuando AWS ParallelCluster detecta que una instancia de nodo de computación estática finaliza de forma inesperada, intenta recuperar la salida de la consola EC2 de la instancia de nodo terminada una vez transcurrido un periodo de tiempo. De esta forma, si el nodo de computación no ha podido comunicarse con Amazon CloudWatch, es posible que se siga obteniendo de la salida de la consola información útil para la solución de problemas sobre por qué finalizó el nodo. Esta salida de la consola se registra en el registro /var/log/parallelcluster/compute_console_output del nodo principal. Para obtener más información acerca de la salida de EC2, consulte Salida de la consola en la Guía del usuario de Amazon EC2 para instancias de Linux.

De forma predeterminada, AWS ParallelCluster solo recupera la salida de la consola de un subconjunto de ejemplos de nodos finalizados. Esto evita que el nodo principal del clúster se vea abrumado por varias solicitudes de salida de la consola provocadas por un gran número de finalizaciones. De forma predeterminada, AWS ParallelCluster espera cinco minutos entre la detección de la finalización y la recuperación de la salida de la consola para que EC2 tenga tiempo de recuperar la salida final de la consola de los nodos.

Puede editar el tamaño de la muestra y los valores de los parámetros del tiempo de espera en el archivo /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf del nodo principal.

Esta característica se añade en la AWS ParallelCluster versión 3.5.0.

Parámetros de salida de la consola EC2

Puede editar los valores de los siguientes parámetros de salida de la consola EC2 en el archivo /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf del nodo principal.

compute_console_logging_enabled

Para deshabilitar la recopilación de registros de salida de la consola, establezca compute_console_logging_enabled en false. El valor predeterminado es true.

Puede actualizar este parámetro en cualquier momento, sin detener la flota de computación.

compute_console_logging_max_sample_size

compute_console_logging_max_sample_size establece el número máximo de nodos de computación desde los que AWS ParallelCluster recopila las salidas de la consola cada vez que detecta una finalización inesperada. Si este valor es inferior a 1, AWS ParallelCluster recupera la salida de la consola de todos los nodos finalizados. El valor predeterminado es 1.

Puede actualizar este parámetro en cualquier momento, sin detener la flota de computación.

compute_console_wait_time

compute_console_wait_time establece el tiempo, en segundos, que AWS ParallelCluster espera entre la detección de un fallo en un nodo y la recopilación de la salida de la consola desde ese nodo. Puede aumentar el tiempo de espera si determina que EC2 necesita más tiempo para recopilar la salida final del nodo finalizado. El valor predeterminado es de 300 segundos (5 minutos).

Puede actualizar este parámetro en cualquier momento, sin detener la flota de computación.