Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

本番環境でモデルを更新するためのデプロイガードレール

フォーカスモード
本番環境でモデルを更新するためのデプロイガードレール - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

デプロイガードレールは、本番環境で機械学習モデルを更新するための Amazon SageMaker AI Inference のモデルデプロイオプションのセットです。このフルマネージドデプロイオプションを使うと、本番環境の現在のモデルから新しいモデルへの切り替えをコントロールできます。Canary や Linear など、ブルー/グリーンデプロイのトラフィックシフトモードにより、更新の過程で現在のモデルから新しいモデルへのトラフィックシフトプロセスを細かくコントロールできます。また、自動ロールバックなどの組み込みセーフガードもあり、本番環境に大きな影響を与える前に、問題を早期に検出し、自動的に是正措置を講じることができます。

デプロイガードレールには次の利点があります。

  • 本番環境を更新する際のデプロイの安全性。本番環境に対して後退的更新を行うと、計画外のダウンタイムが発生し、モデルのレイテンシーの増加や高いエラー率など、ビジネスに影響を与える可能性があります。デプロイガードレールは、ベストプラクティスと組み込みオペレーションの安全なガードレールを提供することで、これらのリスクを軽減するのに役立ちます。

  • フルマネージドデプロイ。SageMaker AI は、これらのデプロイの設定とオーケストレーションを行い、エンドポイント更新メカニズムと統合します。お客様がオーケストレーション、モニタリング、ロールバックのメカニズムを構築、維持する必要はありません。SageMaker AI を活用してこれらのデプロイをセットアップおよびオーケストレーションし、アプリケーションに ML を活用することに専念できます。

  • 可視性。デプロイの進行状況は、DescribeEndpoint API または Amazon CloudWatch Events (サポートされているエンドポイントの場合) を通じて追跡できます。SageMaker AI のイベントの詳細については、「」の「エンドポイントのデプロイ状態の変更」セクションを参照してくださいAmazon SageMaker AI が Amazon EventBridge に送信するイベント。エンドポイントが「Exclusions」ページのいずれかの機能を使っている場合、CloudWatch Events は使用できないことに注意してください。

注記

デプロイガードレールは 非同期推論 エンドポイントタイプと リアルタイム推論 エンドポイントタイプにのみ適用されます。

開始方法

実稼働環境でのモデルの更新には、Blue/Green デプロイとローリングデプロイの 2 種類のデプロイがサポートされています。

  • ブルー/グリーンデプロイ: 更新により、古いフリート (青のフリート) から新しいフリート (緑のフリート) にトラフィックをシフトさせることができます。Blue/Green デプロイは複数のトラフィックシフトモードを提供します。トラフィックシフトモードは、SageMaker AI がエンドポイントトラフィックを更新を含む新しいフリートにルーティングする方法を指定する設定です。次のトラフィックシフトモードでは、エンドポイントの更新プロセスをさまざまなレベルでコントロールできます。

    • All At Once トラフィックシフトを使用する は、すべてのエンドポイントトラフィックを青のフリートから緑のフリートにシフトします。トラフィックが緑のフリートにシフトすると、事前に指定した Amazon CloudWatch アラームが一定期間 (ベーキング期間)、緑のフリートのモニタリングを開始します。ベーキング期間中にアラームが作動しない場合、SageMaker AI はブルーフリートを終了します。

    • Canary トラフィックシフトを使用する では、トラフィックのごく一部 (canary) を緑のフリートにシフトして、ベーキング期間中それをモニタリングできます。Canary がグリーンフリートで成功すると、SageMaker AI は残りのトラフィックをブルーフリートからグリーンフリートに移行してから、ブルーフリートを終了します。

    • Linear トラフィックシフトを使用する は、トラフィックシフトステップの数と各ステップでシフトするトラフィックの割合をさらにカスタマイズできます。Canary シフトではトラフィックを 2 つのステップでシフトできますが、Linear シフトはこれを n 個の線形間隔のステップに拡張します。

  • ローリングデプロイを使用する: SageMaker AI が容量を段階的にプロビジョニングし、指定したバッチサイズのステップでトラフィックを新しいフリートにシフトするときに、エンドポイントを更新できます。新しいフリートのインスタンスは新しいデプロイ設定で更新され、ベーキング期間中に CloudWatch アラームが作動しない場合、SageMaker AI は古いフリートのインスタンスをクリーンアップします。このオプションにより、各ステップで移行するインスタンス数または容量の割合をきめ細かく制御できます。

UpdateEndpointCreateEndpoint SageMaker API、および AWS Command Line Interface コマンドを使用して、デプロイを作成、管理できます。デプロイの設定方法の詳細については、個々のデプロイページを参照してください。エンドポイントが「Exclusions」ページにリストされているいずれかの機能を使っている場合、デプロイガードレールは使用できないことに注意してください。

デプロイガードレールの使用方法を示すガイド付きの例に従うには、Canary および Linear トラフィックシフトモードのJupyter ノートブックの例を参照してください。

このページの内容

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.