翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
スケーリングポリシーを編集する
スケーリングポリシーを作成したら、名前以外の設定を編集できます。
トピック
スケーリングポリシーを編集する (コンソール)
でターゲット追跡スケーリングポリシーを編集するには AWS Management Console、 に使用したのと同じ手順を使用しますコンソールを使用してモデルの自動スケーリングを設定する。
スケーリングポリシー (AWS CLI または Application Auto ScalingAPI) を編集する
AWS CLI または Application Auto Scaling を使用して、新しいスケーリングポリシーを作成するのと同じ方法でスケーリングポリシーAPIを編集できます。詳細については、「スケーリングポリシーを適用する」を参照してください。
スケーリングポリシーを一時的に無効にする
自動スケーリングを設定した後、スケーリングポリシー (動的スケーリング) による干渉なしに問題を調査する必要がある場合は、次のオプションがあります。
-
コマンドまたは register-scalable-target CLI RegisterScalableTargetAPIアクションを呼び出し、 と の両方にブール値を指定して、スケーリングアクティビティを一時的に停止してから再開
DynamicScalingInSuspended
しますDynamicScalingOutSuspended
。次の例は、エンドポイントで
実行されている という名前のバリアントのスケーリングポリシーを停止する方法を示していますmy-variant
。my-endpoint
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --suspended-state '{"DynamicScalingInSuspended":true,"DynamicScalingOutSuspended":true}' -
ポリシーのスケールイン部分を無効にして、特定のターゲット追跡スケーリングポリシーがバリアントでスケーリングされないようにします。この方法では、スケーリングポリシーが必要に応じてインスタンスを作成できるようにしながら、インスタンスを削除できなくなります。
put-scaling-policy CLI コマンドまたは PutScalingPolicyAPIアクションを使用してポリシーを編集し、 のブール値を指定することで、スケールインアクティビティを一時的に無効にしてから有効にします
DisableScaleIn
。以下は、スケールアウトするがスケールインしないスケーリングポリシーのターゲット追跡設定の例です。
{ "TargetValue":
70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance
" }, "DisableScaleIn":true
}