Registri di output della EC2 console Amazon - AWS ParallelCluster

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Registri di output della EC2 console Amazon

Quando AWS ParallelCluster rileva che un'istanza statica del nodo di calcolo termina in modo imprevisto, tenta di recuperare l'output della EC2 console Amazon dall'istanza del nodo terminata dopo un certo periodo di tempo. In questo modo, se il nodo di elaborazione non è in grado di comunicare con Amazon CloudWatch, dall'output della console potrebbero comunque essere recuperate utili informazioni per la risoluzione dei problemi sul motivo per cui il nodo è terminato. L'output della console viene registrato nel /var/log/parallelcluster/compute_console_output registro sul nodo principale. Per ulteriori informazioni sull'output della EC2 console Amazon, consulta l'output della console di istanza nella Amazon EC2 User Guide for Linux Instances.

Per impostazione predefinita, recupera l'output della console AWS ParallelCluster solo da un sottoinsieme campione di nodi terminati. In questo modo si evita che il nodo principale del cluster venga sovraccaricato da più richieste di output da console causate da un numero elevato di terminazioni. Per impostazione predefinita, AWS ParallelCluster attende 5 minuti tra il rilevamento della terminazione e il recupero dell'output della console per dare ad Amazon il EC2 tempo di recuperare l'output finale della console dai nodi.

Puoi modificare la dimensione del campione e i valori dei parametri del tempo di attesa nel /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf file sul nodo principale.

Questa funzionalità è stata aggiunta nella AWS ParallelCluster versione 3.5.0.

Parametri di output della EC2 console Amazon

Puoi modificare i valori dei seguenti parametri di output della EC2 console Amazon nel /etc/parallelcluster/slurm_plugin/parallelcluster_clustermgtd.conf file sul nodo principale.

compute_console_logging_enabled

Per disabilitare la raccolta dei log di output della console, imposta compute_console_logging_enabled sufalse. Il valore predefinito è true.

Puoi aggiornare questo parametro in qualsiasi momento, senza interrompere la flotta di elaborazione.

compute_console_logging_max_sample_size

compute_console_logging_max_sample_sizeimposta il numero massimo di nodi di elaborazione da cui AWS ParallelCluster raccoglie gli output della console ogni volta che rileva una terminazione imprevista. Se questo valore è inferiore a1, AWS ParallelCluster recupera l'output della console da tutti i nodi terminati. Il valore predefinito è 1.

È possibile aggiornare questo parametro in qualsiasi momento, senza interrompere la flotta di elaborazione.

compute_console_wait_time

compute_console_wait_timeimposta il tempo, in secondi, che intercorre tra AWS ParallelCluster il rilevamento di un guasto del nodo e la raccolta dell'output della console da quel nodo. Puoi aumentare il tempo di attesa se ritieni che Amazon EC2 abbia bisogno di più tempo per raccogliere l'output finale dal nodo terminato. Il valore predefinito è 300 secondi (5 minuti).

È possibile aggiornare questo parametro in qualsiasi momento, senza interrompere la flotta di elaborazione.