Schema für Statistiken (Datei statistics.json) - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schema für Statistiken (Datei statistics.json)

Der vorkonfigurierte Container von Amazon SageMaker Model Monitor berechnet Statistiken pro Spalte/Funktion. Die Statistiken werden für den Basis-Datensatz und auch für den aktuellen Datensatz berechnet, der analysiert wird.

{ "version": 0, # dataset level stats "dataset": { "item_count": number }, # feature level stats "features": [ { "name": "feature-name", "inferred_type": "Fractional" | "Integral", "numerical_statistics": { "common": { "num_present": number, "num_missing": number }, "mean": number, "sum": number, "std_dev": number, "min": number, "max": number, "distribution": { "kll": { "buckets": [ { "lower_bound": number, "upper_bound": number, "count": number } ], "sketch": { "parameters": { "c": number, "k": number }, "data": [ [ num, num, num, num ], [ num, num ][ num, num ] ] }#sketch }#KLL }#distribution }#num_stats }, { "name": "feature-name", "inferred_type": "String", "string_statistics": { "common": { "num_present": number, "num_missing": number }, "distinct_count": number, "distribution": { "categorical": { "buckets": [ { "value": "string", "count": number } ] } } }, #provision for custom stats } ] }

Beachten Sie Folgendes:

  • Die vorgefertigte Berechnungsskizze für Container, bei der es sich um eine KLLkompakte Quantilskizze handelt.

  • Standardmäßig materialisieren wir die Verteilung in 10 Buckets. Dies ist derzeit nicht konfigurierbar.