Zeitreihenprognosen in Amazon SageMaker Canvas - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Zeitreihenprognosen in Amazon SageMaker Canvas

Anmerkung

Prognosemodelle für Zeitreihen werden nur für tabellarische Datensätze unterstützt.

Amazon SageMaker Canvas bietet Ihnen die Möglichkeit, Zeitreihenprognosen für maschinelles Lernen zu verwenden. Zeitreihenprognosen bieten Ihnen die Möglichkeit, Vorhersagen zu treffen, die mit der Zeit variieren können.

Sie können eine Zeitreihenprognose für die folgenden Beispiele erstellen:

  • Prognose Ihres Lagerbestands in den kommenden Monaten.

  • Die Anzahl der in den nächsten vier Monaten verkauften Artikel.

  • Die Auswirkung einer Preissenkung auf den Umsatz während der Weihnachtszeit.

  • Artikelbestand in den nächsten 12 Monaten.

  • Die Anzahl der Kunden, die in den nächsten Stunden ein Geschäft betreten.

  • Prognose, wie sich eine Senkung des Preises eines Produkts um 10% auf den Umsatz über einen bestimmten Zeitraum auswirkt.

Um eine Zeitreihenprognose zu erstellen, muss Ihr Datensatz Folgendes enthalten:

  • Eine Zeitstempelspalte mit allen Werten des datetime Typs.

  • Eine Zielspalte mit den Werten, die Sie zur Prognose future Werte verwenden.

  • Eine Artikel-ID-Spalte, die eindeutige Kennungen für jeden Artikel in Ihrem Datensatz enthält, z. B. SKU Zahlen.

Die datetime Werte in der Timestamp-Spalte müssen eines der folgenden Formate verwenden:

  • YYYY-MM-DD HH:MM:SS

  • YYYY-MM-DDTHH:MM:SSZ

  • YYYY-MM-DD

  • MM/DD/YY

  • MM/DD/YY HH:MM

  • MM/DD/YYYY

  • YYYY/MM/DD HH:MM:SS

  • YYYY/MM/DD

  • DD/MM/YYYY

  • DD/MM/YY

  • DD-MM-YY

  • DD-MM-YYYY

Sie können Prognosen für die folgenden Intervalle erstellen:

  • 1 Minute

  • 5 Minuten

  • 15 Minuten

  • 30 Minuten

  • 1 Stunde

  • 1 Tag

  • 1 Woche

  • 1 Monat

  • 1 Jahr

Zukünftige Werte in Ihrem Eingabedatensatz

Canvas erkennt automatisch Spalten in Ihrem Datensatz, die möglicherweise future Werte enthalten könnten. Falls vorhanden, können diese Werte die Genauigkeit von Vorhersagen verbessern. Canvas markiert diese spezifischen Spalten mit einer Future values Bezeichnung. Canvas leitet die Beziehung zwischen den Daten in diesen Spalten und der Zielspalte ab, die Sie vorhersagen möchten, und verwendet diese Beziehung, um genauere Prognosen zu erstellen.

Sie können beispielsweise die Menge an Eiscreme prognostizieren, die in einem Lebensmittelgeschäft verkauft wird. Um eine Prognose erstellen zu können, benötigen Sie eine Zeitstempelspalte und eine Spalte, die angibt, wie viel Eiscreme das Lebensmittelgeschäft verkauft hat. Für eine genauere Prognose kann Ihr Datensatz auch den Preis, die Umgebungstemperatur, den Geschmack der Eiscreme oder eine eindeutige Kennung für die Eiscreme enthalten.

Der Verkauf von Eiscreme kann steigen, wenn das Wetter wärmer ist. Ein Rückgang des Eispreises könnte dazu führen, dass mehr Einheiten verkauft werden. Mit einer Spalte mit Daten zur Umgebungstemperatur und einer Spalte mit Preisdaten können Sie besser prognostizieren, wie viele Eiscremeeinheiten das Lebensmittelgeschäft verkauft.

Die Angabe future Werte ist zwar optional, hilft Ihnen aber dabei, Was-wäre-wenn-Analysen direkt in der Canvas-Anwendung durchzuführen und Ihnen zu zeigen, wie Änderungen future Werte Ihre Prognosen beeinflussen könnten.

Umgang mit fehlenden Werten

Fehlende Daten können aus verschiedenen Gründen auftreten. Der Grund für Ihre fehlenden Daten könnte sich darauf auswirken, wie Canvas sie zuordnen soll. Beispielsweise könnte Ihre Organisation ein automatisches System verwenden, das nur nachverfolgt, wann ein Verkauf stattfindet. Wenn Sie einen Datensatz verwenden, der aus einem solchen automatischen System stammt, fehlen in der Zielspalte Werte.

Wichtig

Wenn in der Zielspalte Werte fehlen, empfehlen wir, einen Datensatz zu verwenden, der diese Werte nicht enthält. SageMaker Canvas verwendet die Zielspalte, um future Werte vorherzusagen. Fehlende Werte in der Zielspalte können die Genauigkeit der Prognose erheblich beeinträchtigen.

Bei fehlenden Werten im Datensatz impliziert Canvas automatisch die fehlenden Werte für Sie, indem die Zielspalte mit dem Medianwert der Spalte 0 und andere numerische Spalten mit dem Medianwert der Spalte gefüllt werden.

Sie können jedoch Ihre eigene Fülllogik für die Zielspalte und andere numerische Spalten in Ihren Datensätzen auswählen. Für Zielspalten gelten andere Richtlinien und Einschränkungen für das Ausfüllen als für die übrigen numerischen Spalten. Zielspalten werden bis zum Ende des historischen Zeitraums gefüllt, während numerische Spalten sowohl für historische als auch für future Perioden bis zum Ende des Prognosezeitraums gefüllt werden. Canvas füllt future Werte in eine numerische Spalte nur, wenn Ihre Daten mindestens einen Datensatz mit einem future Zeitstempel und einem Wert für diese bestimmte Spalte enthalten.

Sie können eine der folgenden Optionen für Fülllogik auswählen, um fehlende Werte in Ihren Daten zu imputieren:

  • zero – Füllen mit 0.

  • NaN – Füllen Sie mit NaN oder keiner Zahl. Dies wird nur für die Zielspalte unterstützt.

  • mean – Füllen Sie mit dem Mittelwert der Datenreihe.

  • median – Füllen Sie mit dem Medianwert der Datenreihe.

  • min – Mit dem Minimalwert aus der Datenreihe auffüllen.

  • max – Mit dem Maximalwert aus der Datenreihe auffüllen.

Bei der Auswahl einer Fülllogik sollten Sie berücksichtigen, wie Ihr Modell die Logik interpretiert. In einem Einzelhandelsszenario unterscheidet sich beispielsweise die Erfassung von Nullverkäufen eines verfügbaren Artikels von der Erfassung von Nullverkäufen eines nicht verfügbaren Artikels, da letzteres Szenario nicht unbedingt einen Mangel an Kundeninteresse an dem nicht verfügbaren Artikel bedeutet. In diesem Fall kann das Ausfüllen mithilfe 0 der Zielspalte des Datensatzes dazu führen, dass das Modell bei seinen Prognosen unvoreingenommen ist und auf mangelndes Kundeninteresse an nicht verfügbaren Artikeln schließen lässt. Umgekehrt NaN kann das Auffüllen mit dazu führen, dass das Modell das tatsächliche Vorkommen von Null verkauften Artikeln unter den verfügbaren Artikeln ignoriert.

Arten von Prognosen

Sie können eine der folgenden Arten von Prognosen erstellen:

  • Einzelner Artikel

  • Alle Elemente

Für eine Prognose für alle Elemente in Ihrem Datensatz gibt SageMaker Canvas eine Prognose für die future Werte für jedes Element in Ihrem Datensatz zurück.

Bei einer Prognose für einen einzelnen Artikel geben Sie das Element an und SageMaker Canvas gibt eine Prognose für die future Werte zurück. Die Prognose umfasst ein Liniendiagramm, in dem die prognostizierten Werte im Zeitverlauf dargestellt werden.