Utilice un SageMaker estimador para realizar un trabajo de formación - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Utilice un SageMaker estimador para realizar un trabajo de formación

También puedes usar un estimador del SDK de SageMaker Python para gestionar la configuración y la ejecución de tu trabajo de SageMaker entrenamiento. En los siguientes ejemplos de código, se muestra cómo configurar y ejecutar un estimador con imágenes de un registro privado de Docker.

  1. Importe las bibliotecas y dependencias necesarias, tal y como se muestra en el siguiente ejemplo de código.

    import boto3 import sagemaker from sagemaker.estimator import Estimator session = sagemaker.Session() role = sagemaker.get_execution_role()
  2. Proporcione un identificador uniforme de recursos (URI) a su imagen de entrenamiento, grupos de seguridad y subredes para la configuración de VPC para su trabajo de entrenamiento, como se muestra en el siguiente ejemplo de código.

    image_uri = "myteam.myorg.com/docker-local/my-training-image:<IMAGE-TAG>" security_groups = ["sg-0123456789abcdef0"] subnets = ["subnet-0123456789abcdef0", "subnet-0123456789abcdef0"]

    Para obtener más información sobre security_group_ids ysubnets, consulte la descripción del parámetro correspondiente en la sección Estimadores del SDK de SageMaker Python.

    nota

    SageMaker utiliza una conexión de red dentro de la VPC para acceder a las imágenes del registro de Docker. Para utilizar las imágenes de su registro de Docker con fines de entrenamiento, debe poder acceder al registro desde una VPC de Amazon de su cuenta.

  3. Si lo desea, si su registro de Docker requiere autenticación, también debe especificar el nombre de recurso de Amazon (ARN) de AWS Lambda una función que proporcione credenciales de acceso a. SageMaker En el siguiente ejemplo, se muestra cómo especificar el ARN.

    training_repository_credentials_provider_arn = "arn:aws:lambda:us-west-2:1234567890:function:test"

    Para obtener más información sobre el uso de imágenes en un registro de Docker que requiera autenticación, consulte Uso de un registro de Docker que requiera autenticación con fines de entrenamiento, a continuación.

  4. Use los ejemplos de código de los pasos anteriores para configurar un estimador, como se muestra en el siguiente ejemplo de código.

    # The training repository access mode must be 'Vpc' for private docker registry jobs training_repository_access_mode = "Vpc" # Specify the instance type, instance count you want to use instance_type="ml.m5.xlarge" instance_count=1 # Specify the maximum number of seconds that a model training job can run max_run_time = 1800 # Specify the output path for the model artifacts output_path = "s3://your-output-bucket/your-output-path" estimator = Estimator( image_uri=image_uri, role=role, subnets=subnets, security_group_ids=security_groups, training_repository_access_mode=training_repository_access_mode, training_repository_credentials_provider_arn=training_repository_credentials_provider_arn, # remove this line if auth is not needed instance_type=instance_type, instance_count=instance_count, output_path=output_path, max_run=max_run_time )
  5. Comience su trabajo de entrenamiento llamando a estimator.fit con el nombre del trabajo y la ruta de entrada como parámetros, tal y como se muestra en el siguiente ejemplo de código.

    input_path = "s3://your-input-bucket/your-input-path" job_name = "your-job-name" estimator.fit( inputs=input_path, job_name=job_name )