Enregistrement d'un modèle (AWS CLI)Enregistrement d'un modèle (API Application Auto Scaling)

Enregistrement d'un modèle

Avant d'ajouter une politique de mise à l'échelle à votre modèle, vous devez d'abord enregistrer votre modèle pour une mise à l'échelle automatique et définir les limites de mise à l'échelle du modèle.

Les procédures suivantes expliquent comment enregistrer un modèle (variante de production) pour le dimensionnement automatique à l'aide de l'API AWS Command Line Interface (AWS CLI) ou Application Auto Scaling.

Rubriques

Enregistrement d'un modèle (AWS CLI)
Enregistrement d'un modèle (API Application Auto Scaling)

Enregistrement d'un modèle (AWS CLI)

Pour enregistrer votre variante de production, utilisez la register-scalable-targetcommande avec les paramètres suivants :

--service-namespace-Définissez cette valeur sur sagemaker.
--resource-id- L’identifiant de la ressource pour le modèle (plus précisément, la variante de production). Pour ce paramètre, le type de ressource est endpoint et l'identifiant unique est le nom de la variante de production. Par exemple, endpoint/my-endpoint/variant/my-variant.
--scalable-dimension-Définissez cette valeur sur sagemaker:variant:DesiredInstanceCount.
--min-capacity: le nombre minimal d'instances. Cette valeur doit être au moins égale à 1 et être inférieure ou égale à celle spécifiée pour max-capacity.
--max-capacity: le nombre maximum d'instances. Cette valeur doit être au moins égale à 1 et être supérieure ou égale à celle spécifiée pour min-capacity.

L'exemple suivant montre comment enregistrer une variante nomméemy-variant, exécutée sur le my-endpoint point de terminaison, qui peut être redimensionnée dynamiquement pour avoir une à huit instances.


aws application-autoscaling register-scalable-target \
  --service-namespace sagemaker \
  --resource-id endpoint/my-endpoint/variant/my-variant \
  --scalable-dimension sagemaker:variant:DesiredInstanceCount \
  --min-capacity 1 \
  --max-capacity 8

Enregistrement d'un modèle (API Application Auto Scaling)

Pour enregistrer votre modèle auprès d'Application Auto Scaling, utilisez l'action API RegisterScalableTargetApplication Auto Scaling avec les paramètres suivants :

ServiceNamespace-Définissez cette valeur sur sagemaker.
ResourceID- L'identifiant de la ressource pour la variante de production. Pour ce paramètre, le type de ressource est endpoint et l'identifiant unique est le nom de la variante. Par exemple endpoint/my-endpoint/variant/my-variant.
ScalableDimension-Définissez cette valeur sur sagemaker:variant:DesiredInstanceCount.
MinCapacity: le nombre minimal d'instances. Cette valeur doit être au moins égale à 1 et être inférieure ou égale à celle spécifiée pour MaxCapacity.
MaxCapacity: le nombre maximum d'instances. Cette valeur doit être au moins égale à 1 et être supérieure ou égale à celle spécifiée pour MinCapacity.


POST / HTTP/1.1
Host: application-autoscaling.us-east-2.amazonaws.com
Accept-Encoding: identity
X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget
X-Amz-Date: 20230506T182145Z
User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4
Content-Type: application/x-amz-json-1.1
Authorization: AUTHPARAMS

{
    "ServiceNamespace": "sagemaker",
    "ResourceId": "endpoint/my-endpoint/variant/my-variant",
    "ScalableDimension": "sagemaker:variant:DesiredInstanceCount",
    "MinCapacity": 1,
    "MaxCapacity": 8
}

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Configuration de la mise à l'échelle automatique d'un modèle avec la console

Définition d'une stratégie de mise à l'échelle