データキャプチャ

エンドポイントへの入力とデプロイされたモデルからの推論出力を Amazon S3 に記録するには、「データキャプチャ」と呼ばれる機能を有効にできます。「データキャプチャ」は通常、トレーニング、デバッグ、モニタリングに使用できる情報を記録するために使用されます。Amazon SageMaker Model Monitor は、このキャプチャされたデータを自動的に解析し、そのデータのメトリクスをモデル用に作成したベースラインと比較します。Model Monitor の詳細については、「Amazon SageMaker Model Monitor を使用したデータとモデルの品質モニタリング」を参照してください。

AWS SDK for Python (Boto) または SageMaker Python SDK を使用して、リアルタイムモードとバッチモデルモニターモードの両方のデータキャプチャを実装できます。リアルタイムエンドポイントの場合は、エンドポイントの作成時に「データキャプチャ」設定を指定します。リアルタイムエンドポイントは永続的であるため、特定の時間にデータキャプチャをオンまたはオフにしたり、サンプリング頻度を変更したりするための追加オプションを設定できます。推論データを暗号化することもできます。

バッチ変換ジョブでは、予定どおりにモデルのモニタリングを実行したり、定期的に行われるバッチ変換ジョブのモデルのモニタリングを継続的に実行したりする場合、「データキャプチャ」を有効にできます。「データキャプチャ」設定は、バッチ変換ジョブを作成するときに指定します。この設定では、暗号化を有効にするか、出力で推論 ID を生成することができます。これにより、キャプチャしたデータを Ground Truth データと一致させることができます。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

モデルのモニタリング

リアルタイムエンドポイントからデータをキャプチャする