Investieren Sie Ground Truth Labels und führen Sie sie mit Vorhersagen zusammen

Bei der Überwachung der Modellqualität werden die Vorhersagen Ihres Modells mit Ground-Truth-Bezeichnungen verglichen, um die Qualität des Modells zu messen. Damit dies funktioniert, kennzeichnen Sie regelmäßig Daten, die von Ihrem Endpunkt- oder Batch-Transformationsauftrag erfasst wurden, und laden sie auf Amazon S3 hoch.

Um Ground-Truth-Bezeichnungen mit erfassten Vorhersagedaten abzugleichen, muss für jeden Datensatz im Datensatz eine eindeutige Kennung vorhanden sein. Die Struktur jedes Datensatzes für Ground-Truth-Daten ist wie folgt:


{
  "groundTruthData": {
    "data": "1",
    "encoding": "CSV" # only CSV supported at launch, we assume "data" only consists of label
  },
  "eventMetadata": {
    "eventId": "aaaa-bbbb-cccc"
  },
  "eventVersion": "0"
}

In der groundTruthData Struktur eventId kann es sich um eine der folgenden Optionen handeln:

eventId – Diese ID wird automatisch generiert, wenn ein Benutzer den Endpunkt aufruft.
inferenceId – Der Anrufer gibt diese ID an, wenn er den Endpunkt aufruft.

Wenn in erfassten Datensätzen vorhanden inferenceId ist, verwendet Model Monitor es, um die erfassten Daten mit Ground-Truth-Datensätzen zusammenzuführen. Sie sind dafür verantwortlich, sicherzustellen, dass die inferenceId in den Ground-Truth-Aufzeichnungen enthaltenen inferenceId Aufzeichnungen mit den erfassten Aufzeichnungen übereinstimmen. Wenn inferenceId es in den erfassten Daten nicht vorhanden ist, verwendet eventId Model Monitor die erfassten Datensätze, um sie mit einem Ground-Truth-Datensatz abzugleichen.

Sie müssen Ground-Truth-Daten in einen Amazon-S3-Bucket hochladen, der dasselbe Pfadformat wie die erfassten Daten hat, und zwar in der folgenden Form:


s3://bucket/prefix/yyyy/mm/dd/hh

Das Datum in diesem Pfad ist das Datum, an dem das Ground-Truth-Etikett erfasst wurde, und muss nicht mit dem Datum übereinstimmen, an dem die Inferenz generiert wurde.

Nachdem Sie die Ground-Truth-Beschriftungen erstellt und hochgeladen haben, geben Sie bei der Erstellung des Monitoring-Auftrages die Position der Beschriftungen als Parameter an. Wenn Sie verwenden AWS SDK for Python (Boto3), tun Sie dies, indem Sie die Position der Ground-Truth-Beschriftungen als S3Uri Feld des GroundTruthS3Input Parameters in einem Aufruf der create_model_quality_job_definition Methode angeben. Wenn Sie SageMaker Python verwendenSDK, geben Sie die Position der Ground-Truth-Beschriftungen als ground_truth_input Parameter beim Aufruf create_monitoring_schedule des ModelQualityMonitor Objekts an.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Planen Sie Jobs zur Überwachung der Modellqualität

Modellqualitätsmetriken und CloudWatch Amazon-Überwachung