Reanudación del entrenamiento a partir de un punto de comprobación - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Reanudación del entrenamiento a partir de un punto de comprobación

Para reanudar un trabajo de entrenamiento desde un punto de control, ejecute un nuevo estimador con el mismo checkpoint_s3_uri que creó en la sección Habilitación de puntos de comprobación. Una vez que se haya reanudado el entrenamiento, se restablecerán los puntos de control de este bucket de S3 a checkpoint_local_path en cada instancia del nuevo trabajo de entrenamiento. Asegúrese de que el depósito de S3 esté en la misma región que el de la sesión de SageMaker IA actual.

Diagrama de arquitectura de la sincronización de puntos de control para reanudar el entrenamiento.