Verwenden von Datasets verwandter Zeitreihen - Amazon Forecast

Amazon Forecast ist für Neukunden nicht mehr verfügbar. Bestehende Kunden von Amazon Forecast können den Service weiterhin wie gewohnt nutzen. Erfahren Sie mehr“

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von Datasets verwandter Zeitreihen

Ein Dataset verwandter Zeitreihen enthält Zeitreihendaten, die nicht in einem Ziel-Zeitreihen-Dataset enthalten sind und möglicherweise die Genauigkeit Ihres Predictors verbessern.

Im Bereich der Bedarfsprognosen würde ein Zielzeitreihendatensatz beispielsweise item_id Dimensionen timestamp und Dimensionen enthalten, während ein ergänzender verwandter Zeitreihendatensatz auch die folgenden zusätzlichen Funktionen enthält: item pricepromotion, und. weather

Ein Dataset verwandter Zeitreihen kann bis zu 10 Prognosedimensionen (die gleichen in Ihrem Ziel-Zeitreihen-Dataset) und bis zu 13 zugehörige Zeitreihen-Funktionen enthalten.

Python-Notizbücher

Eine step-by-step Anleitung zur Verwendung verwandter Zeitreihen-Datasets finden Sie unter Integrieren verwandter Zeitreihen.

Anmerkung

Eine verwandte Zeitreihe, die alle Werte innerhalb des Prognosezeitraums enthält, wird als zukunftsgerichtete Zeitreihe behandelt.

Verwandte Zeitreihen gibt es in zwei Formen:

  • Historische Zeitreihen: Zeitreihen ohne Datenpunkte innerhalb des Prognosehorizonts.

  • Zukunftsorientierte Zeitreihen: Zeitreihen mit Datenpunkten innerhalb des Prognosehorizonts.

Historische Bezugszeitreihen enthalten Datenpunkte bis zum Prognosehorizont und keine Datenpunkte innerhalb des Prognosehorizonts. Zeitreihen, die sich auf die Zukunft beziehen, enthalten Datenpunkte bis zum und innerhalb des Prognosezeitraums.

Time series graph showing target, forward-looking, and historical related data with forecast window.

Für ein Dataset verwandter Zeitreihen gelten die folgenden Einschränkungen:

  • Es darf nicht den Zielwert aus den Ziel-Zeitreihen enthalten.

  • Es muss die Dimensionen item_id und timestamp und mindestens ein verwandtes Feature (z. B. price) enthalten.

  • Funktionsdaten verwandter Zeitreihen müssen vom Datentyp int oder float sein.

  • Um die gesamte Zielzeitreihe verwenden zu können, müssen alle Elemente aus dem Zielzeitreihendatensatz auch im entsprechenden Zeitreihendatensatz enthalten sein. Wenn eine zugehörige Zeitreihe nur eine Teilmenge von Elementen aus der Zielzeitreihe enthält, sind die Modellerstellung und die Generierung von Prognosen auf diese bestimmte Teilmenge von Elementen beschränkt.

    Wenn die Zielzeitreihe beispielsweise 1000 Elemente enthält und der zugehörige Zeitreihendatensatz nur 100 Elemente enthält, dann basieren das Modell und die Prognosen nur auf diesen 100 Elementen.

  • Die Häufigkeit, mit der Daten im zugehörigen Zeitreihen-Dataset erfasst werden, muss mit dem Intervall übereinstimmen, in dem Sie Prognosen generieren möchten (die Prognosegranularität).

    Wenn Sie beispielsweise Prognosen mit einer wöchentlichen Granularität generieren möchten, muss die Häufigkeit, mit der Daten in der zugehörigen Zeitreihe erfasst werden, ebenfalls wöchentlich sein, selbst wenn die Häufigkeit, mit der Daten in der Zielzeitreihe erfasst werden, täglich ist.

  • Die Daten eines jeden Artikels im Dataset verwandter Zeitreihen müssen am oder vor dem Anfangs-timestamp der entsprechenden item_id im Ziel-Zeitreihen-Dataset beginnen.

    Wenn beispielsweise die Daten verwandter Zeitreihen für socks am 01.01.2019 beginnen und die Ziel-Zeitreihen-Daten für shoes am 01.02.2019 beginnen, müssen die Daten verwandter Zeitreihen für socks am oder vordem 01.01.2019 beginnen und die Daten für shoes müssen am oder vordem 01.02.2019 beginnen.

  • Bei zukunftsbezogenen Zeitreihendatensätzen muss sich der letzte Zeitstempel für jedes Element auf dem letzten Zeitstempel im benutzerdefinierten Prognosefenster (dem sogenannten Prognosehorizont) befinden.

    In der nachstehenden Beispieldatei verwandter Zeitreihen müssen die timestamp-Daten sowohl für die Socken und für die Schuhe am oder nach dem 01.07.2019 (dem letzten aufgezeichneten Zeitstempel) plus dem Prognosehorizont enden. Wenn die Datenfrequenz in der Zielzeitreihe täglich ist und der Prognosehorizont 10 Tage beträgt, müssen tägliche Datenpunkte bis zum 11.07.2019 in der Datei mit den entsprechenden zukunftsgerichteten Zeitreihen angegeben werden.

  • Bei historischen Bezugszeitreihendatensätzen muss der letzte Zeitstempel für jedes Element mit dem letzten Zeitstempel in der Zielzeitreihe übereinstimmen.

    In der folgenden Beispieldatei mit verwandten Zeitreihen müssen die timestamp Daten für Socken und Schuhe am 01.07.2019 (dem letzten aufgezeichneten Zeitstempel) enden.

  • Die im zugehörigen Zeitreihendatensatz angegebenen Prognosedimensionen müssen entweder den im Zielzeitreihendatensatz angegebenen Dimensionen entsprechen oder eine Teilmenge davon sein.

  • In verwandten Zeitreihen dürfen keine Werte fehlen. Informationen zu fehlenden Werten in einem verwandten Zeitreihendatensatz finden Sie unter Umgang mit fehlenden Werten.

Die folgende Tabelle zeigt eine korrekt konfigurierte Dataset-Datei verwandter Zeitreihen. Nehmen Sie für dieses Beispiel Folgendes an:

  • Der letzte Datenpunkt wurde am 01.07.2019 im Ziel-Zeitreihen-Dataset aufgezeichnet.

  • Der Prognosehorizont beträgt 10 Tage.

  • Die Prognosegranularität ist täglich (D).

Eine „“-Zeile gibt alle Datenpunkte zwischen den vorherigen und nachfolgenden Zeilen an.

timestamp item_id store price
2019-01-01 Socken NYC 10
2019-01-02 Socken NYC 10
2019-01-03 Socken NYC 15
...
2019-06-01 Socken NYC 10
...
2019-07-01 Socken NYC 10
...
2019-07-11 Socken NYC 20
2019-01-05 Socken SFO 45
...
2019-06-05 Socken SFO 10
...
2019-07-01 Socken SFO 10
...
2019-07-11 Socken SFO 30
2019-02-01 Schuhe ORD 50
...
2019-07-01 Schuhe ORD 75
...
2019-07-11 Schuhe ORD 60

Die folgende Tabelle zeigt kompatible Datenaufzeichnungsfrequenzen für Zielzeitreihen und zugehörige Zeitreihen, die mit einer wöchentlichen Granularität prognostiziert werden sollen. Da Daten in einem verknüpften Zeitreihendatensatz nicht aggregiert werden können, akzeptiert Forecast nur die Häufigkeit verwandter Zeitreihendaten, die der ausgewählten Prognosegranularität entspricht.

Zieleingabedaten (Häufigkeit) Verwandte Zeitreihen (Häufigkeit) Prognose der Granularität Von Forecast unterstützt?
Täglich Wöchentlich Wöchentlich Ja
Wöchentlich Wöchentlich Wöchentlich Ja
N/A Wöchentlich Wöchentlich Ja
Täglich Täglich Wöchentlich Nein
Anmerkung

Informationen zum Upgrade eines vorhandenen Prädiktors auf finden Sie unter AutoPredictor Upgrade auf AutoPredictor

Wenn Sie einen älteren Prädiktor verwenden, können Sie einen verwandten Zeitreihendatensatz verwenden, wenn Sie einen Prädiktor mit den Algorithmen CNN-QR, DeePar+ und Prophet trainieren. NPTSARIMA, und akzeptieren ETSkeine verwandten Zeitreihendaten.

Die folgende Tabelle zeigt die Typen verwandter Zeitreihen, die jeder Amazon Forecast-Algorithmus akzeptiert.

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

Historische Zeitreihen

Zeitreihen in Bezug auf die Zukunft

Wenn Sie AutoML verwenden, können Sie sowohl historische als auch zukunftsgerichtete Zeitreihendaten angeben, und Forecast verwendet gegebenenfalls nur diese Zeitreihen.

Wenn Sie zukunftsbezogene Zeitreihendaten angeben, verwendet Forecast die zugehörigen Daten mit CNN -QR, DeePar+ und Prophet und verwendet die zugehörigen Daten nicht mit, und. NPTS ARIMA ETS Wenn historische Bezugszeitreihendaten bereitgestellt werden, verwendet Forecast die zugehörigen Daten mit CNN -QR und nicht die zugehörigen Daten mit DeePar+, Prophet,, und. NPTS ARIMA ETS