モデルモニターのオフセットリアルタイムエンドポイントにデプロイされたモデルのモデル品質モニタリングバッチ変換ジョブのデータ品質モニタリング

モデルの質モニタリングジョブをスケジュールする

ベースラインを作成したら、ModelQualityMonitor クラスインスタンスの create_monitoring_schedule() メソッドを呼び出して、1 時間ごとにモデル品質モニターをスケジュールできます。以下のセクションでは、リアルタイムエンドポイントにデプロイされたモデルとバッチ変換ジョブのデータ品質モニターを作成する方法を示します。

重要

モニタリングスケジュールを作成するときに、バッチ変換入力またはエンドポイント入力のいずれかを指定できますが、両方を指定することはできません。

データ品質モニタリングとは異なり、モデル品質をモニタリングしたい場合は Ground Truth ラベルを指定する必要があります。ただし、Ground Truth ラベルは遅れる可能性があります。これに対処するには、モニタリングスケジュールを作成するときにオフセットを指定します。

モデルモニターのオフセット

モデル品質のジョブには StartTimeOffset と EndTimeOffset が含まれます。これらは create_model_quality_job_definition メソッドの ModelQualityJobInput パラメータのフィールドで、次のように機能します。

StartTimeOffset - 指定した場合、ジョブはこの時間を開始時刻から減算します。
EndTimeOffset - 指定した場合、ジョブはこの時間を終了時刻から減算します。

例えば、オフセットの形式は -PT7H (7H は 7 時間) です。-P#H または -P#D を使えます (H = 時間、D = 日、M = 分、# は数字)。さらに、オフセットは ISO 8601 期間形式にする必要があります。

例えば、Ground Truth が 1 日後に取り込まれ始めるものの、1 週間では完了しない場合、StartTimeOffset を -P8D に、EndTimeOffset を -P1D に設定します。その後、ジョブを 2020-01-09T13:00 に実行するようにスケジュールした場合、2020-01-01T13:00～2020-01-08T13:00 間のデータが分析されます。

重要

スケジュールの繰り返しの頻度は、1 つの実行が完了してから次の実行を開始するように設定する必要があります。これにより、Ground Truth マージジョブとモニタリングジョブを完了できます。実行の最大ランタイムは 2 つのジョブに分割されるため、1 時間おきに実行されるモデル品質モニタリングジョブの場合、StoppingCondition の一部として指定される MaxRuntimeInSeconds は 1,800 以下にする必要があります。

リアルタイムエンドポイントにデプロイされたモデルのモデル品質モニタリング

リアルタイムエンドポイントのモデル品質モニターをスケジュールするには、次のコードサンプルに示すように、EndpointInput インスタンスを ModelQualityMonitor インスタンスの endpoint_input 引数に渡します。


from sagemaker.model_monitor import CronExpressionGenerator
                    
model_quality_model_monitor = ModelQualityMonitor(
   role=sagemaker.get_execution_role(),
   ...
)

schedule = model_quality_model_monitor.create_monitoring_schedule(
   monitor_schedule_name=schedule_name,
   post_analytics_processor_script=s3_code_postprocessor_uri,
   output_s3_uri=s3_report_path,
   schedule_cron_expression=CronExpressionGenerator.hourly(),    
   statistics=model_quality_model_monitor.baseline_statistics(),
   constraints=model_quality_model_monitor.suggested_constraints(),
   schedule_cron_expression=CronExpressionGenerator.hourly(),
   enable_cloudwatch_metrics=True,
   endpoint_input=EndpointInput(
        endpoint_name=endpoint_name,
        destination="/opt/ml/processing/input/endpoint",
        start_time_offset="-PT2D",
        end_time_offset="-PT1D",
    )
)

バッチ変換ジョブのデータ品質モニタリング

バッチ変換ジョブのデータ品質モニターをスケジュールするには、次のコードサンプルに示すように、BatchTransformInput インスタンスを ModelQualityMonitor インスタンスの batch_transform_input 引数に渡します。


from sagemaker.model_monitor import CronExpressionGenerator

model_quality_model_monitor = ModelQualityMonitor(
   role=sagemaker.get_execution_role(),
   ...
)

schedule = model_quality_model_monitor.create_monitoring_schedule(
    monitor_schedule_name=mon_schedule_name,
    batch_transform_input=BatchTransformInput(
        data_captured_destination_s3_uri=s3_capture_upload_path,
        destination="/opt/ml/processing/input",
        dataset_format=MonitoringDatasetFormat.csv(header=False),
        # the column index of the output representing the inference probablity
        probability_attribute="0",
        # the threshold to classify the inference probablity to class 0 or 1 in 
        # binary classification problem
        probability_threshold_attribute=0.5,
        # look back 6 hour for transform job outputs.
        start_time_offset="-PT6H",
        end_time_offset="-PT0H"
    ),
    ground_truth_input=gt_s3_uri,
    output_s3_uri=s3_report_path,
    problem_type="BinaryClassification",
    constraints = constraints_path,
    schedule_cron_expression=CronExpressionGenerator.hourly(),
    enable_cloudwatch_metrics=True,
)

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

モデルの質ベースラインを作成する

Ground Truth ラベルを取り込んで予測とマージする