Registros de salida de la consola EC2 - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Registros de salida de la consola EC2

CuandoAWS ParallelCluster detecta que una instancia de nodo de cálculo estático termina inesperadamente, intenta recuperar la salida de la consola EC2 de la instancia de nodo finalizada después de que haya transcurrido un período de tiempo. De esta forma, si el nodo de cómputos no podía comunicarse con Amazon CloudWatch, aún podría obtenerse de la salida de la consola información útil para la solución de problemas sobre por qué se cerró el nodo. Esta salida de la consola se registra en el/var/log/parallelcluster/compute_console_output registro del nodo principal. Para obtener más información acerca de la salida de Amazon EC2 para instancias de Linux.

De forma predeterminada,AWS ParallelCluster solo recupera la salida de la consola de un subconjunto de ejemplos de nodos terminados. Esto evita que el nodo principal del clúster se vea abrumado por múltiples solicitudes de salidas de consola causadas por un gran número de terminaciones. De forma predeterminada,AWS ParallelCluster espera 5 minutos entre la detección de la terminación y la recuperación de la salida de la consola para que EC2 tenga tiempo de recuperar la salida final de la consola de los nodos.

Puede editar los valores de los parámetros de tamaño de la muestra y tiempo de espera en el/etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf archivo del nodo principal.

Esta función se ha añadido enAWS ParallelCluster la versión 3.5.

Par

Puede editar los valores de los siguientes parámetros de salida de la consola EC2 en el/etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf archivo del nodo principal.

compute_console_logging_enabled

Para deshabilitar la recopilación de registros de salida de la consola,compute_console_logging_enabled defina enfalse. El valor predeterminado es true.

Puede actualizar este parámetro en cualquier momento, sin detener la asignación de Amazon de Amazon de Amazon de Amazon de Amazon de Amazon de Amazon.

compute_console_logging_max_sample_size

compute_console_logging_max_sample_sizeestablece el número máximo de nodos de procesamiento desde los queAWS ParallelCluster recopila las salidas de la consola cada vez que detecta una terminación inesperada. Si este valor es inferior a1,AWS ParallelCluster recupera la salida de la consola de todos los nodos terminados. El valor predeterminado es 1.

Puede actualizar este parámetro en cualquier momento, sin detener la asignación de Amazon de Amazon de Amazon de Amazon de Amazon de Amazon de Amazon.

compute_console_wait_time

compute_console_wait_timeestablece el tiempo, en segundos, que transcurre entreAWS ParallelCluster la detección de un fallo de nodo y la recopilación de la salida de la consola de ese nodo. Puede aumentar el tiempo de espera si determina que EC2 necesita más tiempo para recopilar la salida final del nodo terminado. El valor predeterminado es de la predeterminado es de la predeterminado es de la predeterminado es de predeterminado es de predeterminado es de

Puede actualizar este parámetro en cualquier momento, sin detener la asignación de Amazon de Amazon de Amazon de Amazon de Amazon de Amazon de Amazon.