Modification d'une stratégie de mise à l'échelle - Amazon SageMaker

Modification d'une stratégie de mise à l'échelle

Vous pouvez modifier une stratégie de mise à l'échelle à l'aide de la AWS Management Console, la AWS CLI ou l'API Application Auto Scaling.

Diminution de charge

Une mise à l'échelle horizontale se produit en l'absence de trafic : si le trafic d'une variante devient nul, SageMaker se met à l'échelle horizontale automatiquement par rapport au nombre minimal d'instances spécifiées. Dans ce cas, SageMaker émet des métriques de valeur nulle. Le nombre minimal d'instances doit être égal ou supérieur à 1.

Désactivation de l'activité de diminution de charge

Vous pouvez empêcher la configuration de stratégie de dimensionnement avec suivi de cible de diminuer la taille de votre variante en désactivant l'activité de diminution en charge. La désactivation de l'activité de diminution de charge empêche la stratégie de dimensionnement de supprimer des instances, tout en autorisant leur création si nécessaire.

Pour activer ou désactiver l'activité de diminution de charge pour votre modèle, spécifiez une valeur booléenne pour DisableScaleIn. Pour plus d'informations sur DisableScaleIn, consultez TargetTrackingScalingPolicyConfiguration dans le manuel Référence d'API Application Auto Scaling.

Voici un exemple de configuration avec suivi de cible pour une stratégie de mise à l'échelle qui effectuera une montée en charge, mais pas de diminution de charge. Dans cette configuration, la métrique SageMakerVariantInvocationsPerInstance prédéfinie effectuera une montée en charge sur la base d'une moyenne de 70 appels (demandes d'inférence) sur toutes les instances dotées du modèle. Cette configuration désactive également l'activité de diminution de charge pour la stratégie de mise à l'échelle.

{ "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" }, "DisableScaleIn": true }

Montée en charge

Pour effectuer une montée en charge manuelle, ajustez la capacité minimale. Vous pouvez utiliser la console pour mettre à jour cette valeur. Vous pouvez également utiliser la AWS CLI avec l'argument --min-capacity ou utiliser le paramètre MinCapacity de l'API Application Auto Scaling.

Désactivation de l'activité de montée en charge

Pour empêcher la montée en charge, ajustez la capacité maximale. Vous pouvez utiliser la console pour mettre à jour cette valeur. Vous pouvez également utiliser la AWS CLI avec l'argument --max-capacity ou utiliser le paramètre MaxCapacity de l'API Application Auto Scaling.

Modification d'une stratégie de mise à l'échelle (console)

Pour modifier une stratégie de mise à l'échelle à l'aide d'AWS Management Console, utilisez la même procédure que celle employée pour Configuration de la mise à l'échelle automatique d'un modèle avec la console.

Modification d'une stratégie de mise à l'échelle (AWS CLI ou API Application Auto Scaling)

Vous pouvez utiliser la AWS CLI ou l'API Application Auto Scaling pour modifier une stratégie de mise à l'échelle de la même manière que pour son application :

  • Lorsque vous utilisez l'AWS CLI, indiquez le nom de la stratégie à modifier dans le paramètre --policy-name. Spécifiez les nouvelles valeurs des paramètres que vous souhaitez modifier.

  • Lorsque vous utilisez l'API Application Auto Scaling, spécifiez le nom de la stratégie à modifier dans le paramètre PolicyName. Spécifiez les nouvelles valeurs des paramètres que vous souhaitez modifier.

Pour de plus amples informations, veuillez consulter Application d'une stratégie de mise à l'échelle.