Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Se utiliza AWS CloudFormation para crear una política de escalado
En el siguiente ejemplo se muestra cómo configurar el escalado automático de modelos en un punto de conexión mediante AWS CloudFormation.
Endpoint: Type: "AWS::SageMaker::Endpoint" Properties: EndpointName:
yourEndpointName
EndpointConfigName:yourEndpointConfigName
ScalingTarget: Type: "AWS::ApplicationAutoScaling::ScalableTarget" Properties: MaxCapacity:10
MinCapacity:2
ResourceId: endpoint/my-endpoint
/variant/my-variant
RoleARN:arn
ScalableDimension: sagemaker:variant:DesiredInstanceCount ServiceNamespace: sagemaker ScalingPolicy: Type: "AWS::ApplicationAutoScaling::ScalingPolicy" Properties: PolicyName:my-scaling-policy
PolicyType: TargetTrackingScaling ScalingTargetId: Ref: ScalingTarget TargetTrackingScalingPolicyConfiguration: TargetValue:70.0
ScaleInCooldown:600
ScaleOutCooldown:30
PredefinedMetricSpecification: PredefinedMetricType: SageMakerVariantInvocationsPerInstance
Para obtener más información, consulte Create Application Auto Scaling resources with AWS CloudFormation en la Guía del usuario de Application Auto Scaling.