翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI モデルの自動スケーリング
Amazon SageMaker AI は、ホストされたモデルの自動スケーリング (自動スケーリング) をサポートしています。自動スケーリングは、ワークロードの変動に応じて、モデルにプロビジョニングされるインスタンスの数を動的に調整します。ワークロードが増加すると、自動スケーリングはより多くのインスタンスをオンラインにします。ワークロードが減少すると、自動スケーリングは使用していないプロビジョニングされたインスタンスに対して支払いが発生しないように、不要なインスタンスを削除します。
トピック
- 自動スケーリングポリシーの概要
- 自動スケーリングの前提条件
- コンソールを使用してモデルの自動スケーリングを設定する
- モデルの登録
- スケーリングポリシーを定義する
- スケーリングポリシーを適用する
- スケーリングポリシーを編集する手順
- スケーリングポリシーを一時的に無効にする
- スケーリングポリシーを削除する
- スケーリングアクティビティを記述してスケーリングアクティビティのステータスを確認する
- エンドポイントをゼロインスタンスにスケールする
- 自動スケーリング設定の負荷テスト
- AWS CloudFormation を使用してスケーリングポリシーを作成する
- 自動スケーリングを使用するエンドポイントを更新する
- 自動スケーリングに設定されたエンドポイントを削除する