As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Registros de saída EC2 do console Amazon
Quando AWS ParallelCluster detecta que uma instância de nó computacional estático termina inesperadamente, ela tenta recuperar a saída do EC2 console Amazon da instância do nó encerrado após um período de tempo decorrido. Dessa forma, se o nó de computação não conseguir se comunicar com a Amazon CloudWatch, informações úteis de solução de problemas sobre o motivo pelo qual o nó foi encerrado ainda poderão ser recuperadas da saída do console. Essa saída do console é gravada no log /var/log/parallelcluster/compute_console_output
no nó principal. Para obter mais informações sobre a saída do EC2 console Amazon, consulte Saída do console de instância no Guia EC2 do usuário da Amazon para instâncias Linux.
Por padrão, AWS ParallelCluster só recupera a saída do console de um subconjunto de amostra de nós terminados. Isso evita que o nó principal do cluster fique sobrecarregado com várias solicitações de saída do console causadas por um grande número de encerramentos. Por padrão, AWS ParallelCluster aguarda 5 minutos entre a detecção da terminação e a recuperação da saída do console para que a Amazon EC2 tenha tempo de recuperar a saída final do console dos nós.
Você pode editar o tamanho da amostra e os valores dos parâmetros de tempo de espera no arquivo /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf
no nó principal.
Esse recurso foi adicionado na AWS ParallelCluster versão 3.5.0.
Parâmetros de saída EC2 do console Amazon
Você pode editar os valores dos seguintes parâmetros de saída EC2 do console Amazon no /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf
arquivo no nó principal.
compute_console_logging_enabled
Para desativar a coleta de log de saída do console, defina compute_console_logging_enabled
comofalse
. O padrão é true
.
Você pode atualizar esse parâmetro a qualquer momento, sem interromper a frota de computação.
compute_console_logging_max_sample_size
compute_console_logging_max_sample_size
define o número máximo de nós de computação dos quais AWS ParallelCluster coleta as saídas do console sempre que detecta uma terminação inesperada. Se esse valor for menor que1
, AWS ParallelCluster recupera a saída do console de todos os nós terminados. O valor padrão é 1
.
Você pode atualizar esse parâmetro a qualquer momento, sem interromper a frota de computação.
compute_console_wait_time
compute_console_wait_time
define o tempo de AWS ParallelCluster espera, em segundos, entre a detecção de uma falha no nó e a coleta da saída do console desse nó. Você pode aumentar o tempo de espera se determinar que a Amazon EC2 precisa de mais tempo para coletar a saída final do nó encerrado. O valor padrão é de 300 segundos (5 minutos).
Você pode atualizar esse parâmetro a qualquer momento, sem interromper a frota de computação.