Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AWS ParallelClusterProceso de
Esta sección se aplica a los clústeres que se implementan conSlurm. Cuando se usa con este programador,AWS ParallelClusteradministra el aprovisionamiento del nodo de computación y su eliminación interactuando con el programador de trabajos subyacente.
Para clústeres de HPC que se basan enAWS Batch,AWS ParallelClusterse basa en las capacidades proporcionadas por elAWS Batchpara la administración de nodos de procesamiento.
clustermgtd
El demonio de administración de clústeres realiza las siguientes tareas.
-
Limpieza de particiones inactivas
-
Administración de la capacidad estática: asegúrese de que la capacidad estática esté siempre activa y en buen estado
-
Sincronice el programador con Amazon EC2.
-
Limpieza de instancias huérfanas
-
Restaurar el estado del nodo programador en la terminación de Amazon EC2 que ocurre fuera del flujo de trabajo de suspensión
-
Administración de instancias de Amazon EC2 en mal estado (no pasa las comprobaciones de estado de Amazon EC2
-
Gestión de eventos de mantenimiento programados
-
Administración de nodos del Programador en mal estado (comprobaciones de estado del Programador que no
clusterstatusmgtd
El demonio de administración del estado del clúster administra la actualización del estado de la flota de computación. Cada minuto obtiene el estado de la flota almacenado en una tabla de DynamoDB y gestiona cualquier solicitud de STOP/START.
computemgtd
Demonio de administración informática (computemgtd
Proceso de Cada cinco (5) minutos, el demonio de administración de cómputos confirma que se puede alcanzar el nodo principal y que está en buen estado. Si transcurren cinco (5) minutos durante los cuales no se puede alcanzar el nodo principal o no está en buen estado, el nodo de procesamiento se cierra.