Registrar un modelo - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Registrar un modelo

Antes de agregar una política de escalado a su modelo, primero debe registrar su modelo para el autoescalado y definir los límites de escalado del modelo.

Los siguientes procedimientos explican cómo registrar un modelo (variante de producción) para el escalado automático mediante AWS Command Line Interface (AWS CLI) o la API Application Auto Scaling.

Registrar un modelo (AWS CLI)

Para registrar su variante de producción, utilice el register-scalable-targetcomando con los siguientes parámetros:

  • --service-namespace: establezca este valor en sagemaker.

  • --resource-id: el identificador de recursos del modelo (en concreto, la variante de producción). Para este parámetro, el tipo de recurso es endpoint y el identificador único es el nombre de la variante de producción. Por ejemplo, endpoint/my-endpoint/variant/my-variant.

  • --scalable-dimension: establezca este valor en sagemaker:variant:DesiredInstanceCount.

  • --min-capacity—El número mínimo de instancias. Este valor debe establecerse en al menos 1 y debe ser igual o inferior al valor especificado para max-capacity.

  • --max-capacity—El número máximo de instancias. Este valor debe establecerse en al menos 1 y debe ser igual o superior al valor especificado para min-capacity.

En el siguiente ejemplomy-variant, se muestra cómo registrar una variante denominada que se ejecuta en el my-endpoint punto final y que se puede escalar dinámicamente para tener de una a ocho instancias.

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

Registrar un modelo (API de Application Auto Scaling)

Para registrar un modelo con Application Auto Scaling, use la acción de API RegisterScalableTarget de Application Auto Scaling con los siguientes parámetros.

  • ServiceNamespace: establezca este valor en sagemaker.

  • ResourceID: el identificador de recurso para la variante de producción. Para este parámetro, el tipo de recurso es endpoint y el identificador único es el nombre de la variante. Por ejemplo, endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension: establezca este valor en sagemaker:variant:DesiredInstanceCount.

  • MinCapacity—El número mínimo de instancias. Este valor debe establecerse en al menos 1 y debe ser igual o inferior al valor especificado para MaxCapacity.

  • MaxCapacity—El número máximo de instancias. Este valor debe establecerse en al menos 1 y debe ser igual o superior al valor especificado para MinCapacity.

En el siguiente ejemplomy-variant, se muestra cómo registrar una variante denominada que se ejecuta en el my-endpoint punto final y que se puede escalar dinámicamente para utilizar de una a ocho instancias.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }