Cómo SageMaker procesa Amazon el resultado de la formación - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cómo SageMaker procesa Amazon el resultado de la formación

Puesto que su algoritmo se ejecuta en un contenedor, genera la salida incluyendo el estado del modelo y el trabajo de capacitación, y los artefactos de salida. Su algoritmo debe escribir esta información en los siguientes archivos, que se encuentran en el directorio /output del contenedor. Amazon SageMaker procesa la información contenida en este directorio de la siguiente manera:

  • /opt/ml/model— Su algoritmo debería escribir todos los artefactos finales del modelo en este directorio. SageMaker copia estos datos como un único objeto en formato tar comprimido en la ubicación S3 que especificó en la CreateTrainingJob solicitud. Si varios contenedores de un mismo trabajo de formación escriben en este directorio, deben asegurarse de que no haya ningún conflicto entre file/directory nombres. SageMakeragrega el resultado en un TAR archivo y lo carga en S3 al final del trabajo de capacitación.

  • /opt/ml/output/data— Su algoritmo debería escribir en este directorio los artefactos que desee almacenar además del modelo final. SageMakercopia estos datos como un único objeto en formato tar comprimido en la ubicación S3 que especificó en la CreateTrainingJob solicitud. Si varios contenedores de un mismo trabajo de formación escriben en este directorio, deben asegurarse de que no haya ningún conflicto entre file/directory nombres. SageMaker agrega el resultado en un TAR archivo y lo carga en S3 al final del trabajo de capacitación.

  • /opt/ml/output/failure: si se produce un error en la entrenamiento, después de que toda la salida del algoritmo (por ejemplo, registro) se complete, el algoritmo debe escribir la descripción de errores en este archivo. En una DescribeTrainingJob respuesta, SageMaker devuelve los primeros 1024 caracteres de este archivo como. FailureReason

Puede especificar un bucket de S3 de uso general o un bucket de directorio de S3 para almacenar el resultado del entrenamiento. Los buckets de directorio utilizan únicamente la clase de almacenamiento Amazon S3 Express One Zone, que está diseñada para cargas de trabajo o aplicaciones de rendimiento crítico que requieren una latencia constante de milisegundos de un solo dígito. Elija el tipo de bucket que mejor se adapte a sus requisitos de rendimiento y aplicación. Para obtener más información sobre los depósitos de directorio de S3, consulte los depósitos de directorio en la Guía del usuario de Amazon Simple Storage Service.