Utiliser AWS CloudFormation pour mettre à jour les stratégies de mise à l'échelle automatique
L’exemple suivant montre comment activer la mise à l'échelle automatique sur un point de terminaison à l'aide de AWS CloudFormation.
Endpoint: Type: "AWS::SageMaker::Endpoint" Properties: EndpointName:
yourEndpointName
EndpointConfigName:yourEndpointConfigName
ScalingTarget: Type: "AWS::ApplicationAutoScaling::ScalableTarget" Properties: MaxCapacity:10
MinCapacity:2
ResourceId:endpoint/MyEndPoint/variant/MyVariant
RoleARN:arn
ScalableDimension: sagemaker:variant:DesiredInstanceCount ServiceNamespace: sagemaker ScalingPolicy: Type: "AWS::ApplicationAutoScaling::ScalingPolicy" Properties: PolicyName:myscalablepolicy
PolicyType: TargetTrackingScaling ScalingTargetId: Ref: ScalingTarget TargetTrackingScalingPolicyConfiguration: TargetValue:75.0
ScaleInCooldown:600
ScaleOutCooldown:30
PredefinedMetricSpecification: PredefinedMetricType: SageMakerVariantInvocationsPerInstance
Pour plus d'informations, consultez la section Référence de l'API AutoScalingPlans de AWS CloudFormation.