Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Aplicar una política de escalado
Después de registrar el modelo y definir una política de escalado, aplíquela al modelo registrado. En esta sección se muestra cómo aplicar una política de escalado mediante AWS Command Line Interface (AWS CLI) o la API Application Auto Scaling.
Temas
Aplique una política de escalado y seguimiento de objetivos (AWS CLI)
Para aplicar una política de escalado a su modelo, utilice el put-scaling-policy AWS CLI comando con los siguientes parámetros:
-
--policy-name
: el nombre de la política de escalado. -
--policy-type
: establezca este valor enTargetTrackingScaling
. -
--resource-id
: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpoint
y el identificador único es el nombre de la variante. Por ejemplo,endpoint/
.my-endpoint
/variant/my-variant
-
--service-namespace
: establezca este valor ensagemaker
. -
--scalable-dimension
: establezca este valor ensagemaker:variant:DesiredInstanceCount
. -
--target-tracking-scaling-policy-configuration
—La configuración de la política de escalado de seguimiento de objetivos que se utilizará en el modelo.
En el siguiente ejemplo, se aplica una política de escalado de seguimiento de objetivos denominada
a una variante denominadamy-scaling-policy
, que se ejecuta en el my-variant
punto final. Para la my-endpoint
--target-tracking-scaling-policy-configuration
opción, especifique el config.json
archivo que creó anteriormente.
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Aplicación de una política de escalado (API de Application Auto Scaling)
Para aplicar una política de escalado a una variante con la API Application Auto Scaling, utilice la acción PutScalingPolicyApplication Auto Scaling API con los siguientes parámetros:
-
PolicyName
: el nombre de la política de escalado. -
ServiceNamespace
: establezca este valor ensagemaker
. -
ResourceID
: el identificador de recurso para la variante. Para este parámetro, el tipo de recurso esendpoint
y el identificador único es el nombre de la variante. Por ejemplo,endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
: establezca este valor ensagemaker:variant:DesiredInstanceCount
. -
PolicyType
: establezca este valor enTargetTrackingScaling
. -
TargetTrackingScalingPolicyConfiguration
: configuración de la política de escalado de seguimiento de objetivos que se usará para la variante.
En el siguiente ejemplo, se aplica una política de escalado de seguimiento de objetivos denominada
a una variante denominadamy-scaling-policy
, que se ejecuta en el my-variant
punto final. La configuración de la política mantiene el promedio de invocaciones por instancia en 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }