Generierung von Visualisierungen und Dateneinblicken - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Generierung von Visualisierungen und Dateneinblicken

Nachdem Sie Ihre Daten in Data Wrangler importiert haben, können Sie sie verwenden, um Visualisierungen und Dateneinblicke zu generieren.

  • Visualisierungen: Data Wrangler kann verschiedene Arten von Diagrammen erstellen, z. B. Histogramme und Streudiagramme. Sie können beispielsweise ein Histogramm erstellen, um Ausreißer in Ihren Daten zu identifizieren.

  • Dateneinblicke: Sie können einen Datenqualitäts- und Insights-Bericht für Amazon Personalize verwenden, um anhand von Dateneinblicken sowie Spalten- und Zeilenstatistiken mehr über Ihre Daten zu erfahren. Dieser Bericht kann Sie darüber informieren, ob Sie irgendwelche Typprobleme mit Ihren Daten haben. Außerdem erfahren Sie, welche Maßnahmen Sie ergreifen können, um Ihre Daten zu verbessern. Diese Maßnahmen können Ihnen helfen, die Ressourcenanforderungen von Amazon Personalize zu erfüllen, z. B. die Anforderungen an die Modellschulung, oder sie können zu verbesserten Empfehlungen führen.

Nachdem Sie mithilfe von Visualisierungen und Erkenntnissen mehr über Ihre Daten erfahren haben, können Sie diese Informationen verwenden, um zusätzliche Transformationen zur Verbesserung Ihrer Daten anzuwenden. Oder, wenn Sie mit der Vorbereitung Ihrer Daten fertig sind, können Sie sie verarbeiten und in Amazon Personalize importieren. Informationen zur Transformation Ihrer Daten finden Sie unterDaten transformieren. Hinweise zum Verarbeiten und Importieren von Daten finden Sie unterDaten verarbeiten und in Amazon Personalize importieren.

Generieren von Visualisierungen

Sie können Data Wrangler verwenden, um verschiedene Arten von Diagrammen zu erstellen, z. B. Histogramme und Streudiagramme. Sie können beispielsweise ein Histogramm erstellen, um Ausreißer in Ihren Daten zu identifizieren. Um eine Datenvisualisierung zu generieren, fügen Sie Ihrem Schema einen Analyseschritt hinzu und wählen unter Analysetyp die Visualisierung aus, die Sie erstellen möchten.

Weitere Informationen zum Erstellen von Visualisierungen in Data Wrangler finden Sie unter Analysieren und Visualisieren im Amazon Developer Guide. SageMaker

Generierung von Erkenntnissen aus Daten

Sie können Data Wrangler verwenden, um einen Datenqualitäts- und Insights-Bericht für Amazon Personalize zu erstellen, der für Ihren Datensatztyp spezifisch ist. Bevor Sie den Bericht erstellen, empfehlen wir Ihnen, Ihre Daten so zu transformieren, dass sie die Anforderungen von Amazon Personalize erfüllen. Dies wird zu relevanteren Erkenntnissen führen. Weitere Informationen finden Sie unter Daten transformieren.

Inhalt melden

Der Datenqualitäts- und Insights-Bericht für Amazon Personalize umfasst die folgenden Abschnitte:

  • Zusammenfassung: Die Berichtszusammenfassung umfasst Datensatzstatistiken und Warnungen mit hoher Priorität:

    • Datensatzstatistiken: Dazu gehören spezifische Statistiken von Amazon Personalize, wie z. B. die Anzahl der eindeutigen Benutzer in Ihren Interaktionsdaten, und allgemeine Statistiken, wie die Anzahl fehlender Werte oder Ausreißer.

    • Warnungen mit hoher Priorität: Dies sind spezifische Erkenntnisse von Amazon Personalize, die sich am stärksten auf Schulungen oder Empfehlungen auswirken. Jede Warnung enthält eine empfohlene Maßnahme, die Sie ergreifen können, um das Problem zu lösen.

  • Doppelte Zeilen und Unvollständige Zeilen: Diese Abschnitte enthalten Informationen darüber, in welchen Zeilen Werte fehlen und welche Zeilen in Ihren Daten doppelt vorkommen.

  • Zusammenfassung der Funktionen: Dieser Abschnitt enthält den Datentyp für jede Spalte, ungültige oder fehlende Dateninformationen und die Anzahl der Warnungen.

  • Funktionsdetails: Dieser Abschnitt enthält Unterabschnitte mit detaillierten Informationen für jede Ihrer Datenspalten. Jeder Unterabschnitt enthält Statistiken für die Spalte, z. B. die Anzahl der kategorialen Werte und Informationen zu fehlenden Werten. Und jeder Unterabschnitt enthält spezifische Einblicke und Handlungsempfehlungen von Amazon Personalize für Datenspalten. Ein Einblick könnte beispielsweise darauf hindeuten, dass eine Spalte mehr als 30 mögliche Kategorien hat.

Probleme mit dem Datentyp

Der Bericht identifiziert Spalten, die nicht den richtigen Datentyp haben, und gibt den erforderlichen Typ an. Um Einblicke in diese Funktionen zu erhalten, müssen Sie den Datentyp der Spalte konvertieren und den Bericht erneut generieren. Um den Typ zu konvertieren, können Sie die Data Wrangler-Transformation „Wert als Typ analysieren“ verwenden.

Einblicke in Amazon Personalize

Die Erkenntnisse von Amazon Personalize beinhalten ein Ergebnis und eine vorgeschlagene Maßnahme. Die Aktion ist optional. Der Bericht könnte beispielsweise Erkenntnisse und Maßnahmen in Bezug auf die Anzahl der Kategorien für eine Spalte mit kategorialen Daten enthalten. Wenn Sie nicht glauben, dass es sich bei der Spalte um eine kategorische Spalte handelt, können Sie diese Erkenntnis ignorieren und keine Maßnahmen ergreifen.

Bis auf geringfügige Formulierungsunterschiede sind die spezifischen Erkenntnisse von Amazon Personalize dieselben wie die Erkenntnisse aus einzelnen Datensätzen, die Sie möglicherweise generieren, wenn Sie Ihre Daten mit Amazon Personalize analysieren. Der Insights-Bericht in Data Wrangler enthält beispielsweise Erkenntnisse wie „Der Datensatz mit Artikelinteraktionen hat nur X eindeutige Benutzer mit zwei oder mehr Interaktionen“. Er enthält jedoch keine Erkenntnisse wie „X% der Elemente im Artikeldatensatz haben keine Interaktionen im Datensatz Artikelinteraktionen“.

Eine Liste möglicher Amazon Personalize Personalize-spezifischer Erkenntnisse finden Sie in den Erkenntnissen, die nicht auf mehrere Datensätze verweisen. Einblicke in Daten

Berichtsbeispiele

Das Erscheinungsbild des Amazon Personalize entspricht dem allgemeinen Insights-Bericht in Data Wrangler. Beispiele für den allgemeinen Insights-Bericht finden Sie unter Get Insights On Data and Data Quality im Amazon SageMaker Developer Guide. Das folgende Beispiel zeigt, wie der Zusammenfassungsbereich eines Berichts für einen Datensatz mit Artikelinteraktionen aussieht. Es enthält Datensatzstatistiken und einige mögliche Warnungen zu Datensätzen mit hoher Priorität zu Artikelinteraktionen.

Stellt den zusammenfassenden Abschnitt eines Berichts für einen Datensatz mit Artikelinteraktionen dar.

Das folgende Beispiel zeigt, wie der Abschnitt mit den Feature-Details für eine TYPE Spalte EVENT _ eines Datensatzes mit Artikelinteraktionen in einem Bericht erscheinen könnte.

Stellt den Abschnitt mit den Feature-Details für eine TYPE Spalte EVENT _ eines Datensatzes mit Artikelinteraktionen dar.

Der Bericht wird generiert

Um den Datenqualitäts- und Insights-Bericht für Amazon Personalize zu erstellen, wählen Sie Dateneinblicke für Ihre Transformation abrufen und eine Analyse erstellen.

Um einen Datenqualitäts- und Insights-Bericht für Amazon Personalize zu erstellen
  1. Wählen Sie die Option + für die Transformation, die Sie analysieren. Wenn Sie keine Transformation hinzugefügt haben, wählen Sie + für die Transformation der Datentypen. Data Wrangler fügt diese Transformation automatisch zu Ihrem Flow hinzu.

  2. Wählen Sie Get Data Insights aus. Das Fenster Analyse erstellen wird angezeigt.

  3. Wählen Sie als Analysetyp Data Quality and Insights Report for Amazon Personalize aus.

  4. Wählen Sie unter Datensatztyp den Typ des Amazon Personalize Personalize-Datensatzes aus, den Sie analysieren.

  5. Wählen Sie optional Auf vollständigen Daten ausführen aus. Standardmäßig generiert Data Wrangler nur Erkenntnisse aus einer Stichprobe Ihrer Daten.

  6. Wählen Sie Create (Erstellen) aus. Wenn die Analyse abgeschlossen ist, wird der Bericht angezeigt.