Recuperación automática de nodos - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Recuperación automática de nodos

Durante la creación o actualización del clúster, los usuarios administradores del clúster pueden seleccionar la opción de recuperación de nodos (instancia) entre Automatic (recomendado) y None en el clúster. Si se establece en Automatic, SageMaker HyperPod se reinicia o reemplaza automáticamente los nodos defectuosos.

importante

Se recomienda configurar la opción Automatic.

La recuperación automática de nodos se ejecuta cuando un agente de supervisión del estado, las comprobaciones de estado básicas y las comprobaciones de estado exhaustivas detectan problemas. Si se establece en None, el agente de supervisión del estado etiquetará las instancias cuando se detecte un error, pero no iniciará automáticamente ninguna acción de reparación ni recuperación en los nodos afectados. No se recomienda usar esta opción.