Verwenden von Datasets verwandter Zeitreihen - Amazon Forecast

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von Datasets verwandter Zeitreihen

Ein Dataset verwandter Zeitreihen enthält Zeitreihendaten, die nicht in einem Ziel-Zeitreihen-Dataset enthalten sind und möglicherweise die Genauigkeit Ihres Predictors verbessern.

Beispielsweise könnte ein Dataset verwandter Zeitreihen in der Nachfrageprognosedomäne enthaltentimestampunditem_idDimensionen, während ein komplementärer verwandter Zeitreihendatensatz auch die folgenden zusätzlichen Funktionen enthält:item price,promotion, undweatheraus.

Ein Dataset verwandter Zeitreihen kann bis zu 10 Prognosedimensionen (die gleichen in Ihrem Ziel-Zeitreihen-Dataset) und bis zu 13 zugehörige Zeitreihen-Funktionen enthalten.

Python-Notebooks

Für ein step-by-step Leitfaden zur Verwendung verwandter Zeitreihen-Datasets finden Sie unterIntegrieren von zugehörigen Zeitreihenaus.

Anmerkung

Eine verwandte Zeitreihe, die Werte innerhalb des Prognosehorizonts enthält, wird als zukunftsgerichtete Zeitreihe behandelt.

Verwandte Zeitreihen werden in zwei Formen angeboten:

  • Historische Zeitreihen: ZeitreihenohneDatenpunkte innerhalb des Prognosehorizonts.

  • Zukunftsgerichtete Zeitreihen: ZeitreihenmitDatenpunkte innerhalb des Prognosehorizonts.

Historisch verwandte Zeitreihen enthalten Datenpunkte bis zum Prognosehorizont und enthalten keine Datenpunkte innerhalb des Prognosehorizonts. Zukunftsgerichtete verwandte Zeitreihen enthalten Datenpunkte bis zuundIm Prognosehorizont.

Für ein Dataset verwandter Zeitreihen gelten die folgenden Einschränkungen:

  • Es darf nicht den Zielwert aus den Ziel-Zeitreihen enthalten.

  • Es muss die Dimensionen item_id und timestamp und mindestens ein verwandtes Feature (z. B. price) enthalten.

  • Funktionsdaten verwandter Zeitreihen müssen vom Datentyp int oder float sein.

  • Um die gesamte Zielzeitreihe verwenden zu können, müssen alle Artikel aus dem Ziel-Zeitreihen-Dataset ebenfalls in das Dataset verwandter Zeitreihen aufgenommen werden. Wenn eine verwandte Zeitreihe nur eine Teilmenge von Elementen aus der Zielzeitreihe enthält, ist die Modellerstellung und die Prognosegenerierung auf diese spezifische Teilmenge von Elementen beschränkt.

    Wenn die Zielzeitreihe beispielsweise 1000 Elemente enthält und der zugehörige Zeitreihendatensatz nur 100 Elemente enthält, basieren das Modell und die Prognosen nur auf diesen 100 Elementen.

  • Die Häufigkeit, mit der Daten im zugehörigen Zeitreihen-Dataset erfasst werden, muss mit dem Intervall übereinstimmen, in dem Sie Prognosen generieren möchten (die Prognosegranularität).

    Wenn Sie beispielsweise Prognosen mit einer wöchentlichen Granularität generieren möchten, muss die Häufigkeit, mit der Daten in der zugehörigen Zeitreihe erfasst werden, ebenfalls wöchentlich sein, selbst wenn die Häufigkeit, mit der Daten in der Zielzeitreihe erfasst werden, täglich ist.

  • Die Daten eines jeden Artikels im Dataset verwandter Zeitreihen müssen am oder vor dem Anfangs-timestamp der entsprechenden item_id im Ziel-Zeitreihen-Dataset beginnen.

    Wenn beispielsweise die Daten verwandter Zeitreihen für socks am 01.01.2019 beginnen und die Ziel-Zeitreihen-Daten für shoes am 01.02.2019 beginnen, müssen die Daten verwandter Zeitreihen für socks am oder vordem 01.01.2019 beginnen und die Daten für shoes müssen am oder vordem 01.02.2019 beginnen.

  • Für zukunftsgerichtete verwandter Zeitreihen-Datasets muss der letzte Zeitstempel für jedes Element auf dem letzten Poststempel im benutzerdefinierten Prognosefenster (alsPrognosezeitraum) enthalten.

    In der nachstehenden Beispieldatei verwandter Zeitreihen müssen die timestamp-Daten sowohl für die Socken und für die Schuhe am oder nach dem 01.07.2019 (dem letzten aufgezeichneten Zeitstempel) plus dem Prognosehorizont enden. Wenn die Datenfrequenz in Zielzeitreihen täglich ist und der Prognosehorizont 10 Tage beträgt, müssen die täglichen Datenpunkte bis zum 11.07.2019 in der zukunftsgerichteten Zeitreihendatei angegeben werden.

  • Für historische verwandte Zeitreihen-Datasets muss der letzte Zeitstempel für jedes Element mit dem letzten Zeitstempel in der Zielzeitreihe übereinstimmen.

    In der folgenden Beispieldatei für Zeitreihen wird dietimestampDie Daten sowohl für die Socken und für die Schuhe müssen am 01.07.2019 (dem letzten aufgezeichneten Zeitstempel) enden.

  • Die im Dataset verwandter Zeitreihen bereitgestellten Prognose-Dimensionen müssen entweder gleich den Dimensionen oder eine Teilmenge der Dimensionen sein, die im Ziel-Zeitreihen-Dataset angegeben sind.

  • Verwandte Zeitreihen dürfen keine fehlenden Werte aufweisen. Informationen zu fehlenden Werten in einem verwandten Zeitreihen-Dataset finden Sie unterUmgang mit fehlenden Wertenaus.

Die folgende Tabelle zeigt eine korrekt konfigurierte Dataset-Datei verwandter Zeitreihen. Nehmen Sie für dieses Beispiel Folgendes an:

  • Der letzte Datenpunkt wurde am 01.07.2019 im Ziel-Zeitreihen-Dataset aufgezeichnet.

  • Der Prognosehorizont beträgt 10 Tage.

  • Die Prognosegranularität ist täglich (D).

EIN“„Zeile gibt alle Datenpunkte zwischen den vorherigen und nachfolgenden Zeilen an.

timestamp item_id store price
2019-01-01 Socken NYC 10
2019-01-02 Socken NYC 10
2019-01-03 Socken NYC 15
...
2019-06-01 Socken NYC 10
...
2019-07-01 Socken NYC 10
...
2019-07-11 Socken NYC 20
2019-01-05 Socken SFO 45
...
2019-06-05 Socken SFO 10
...
2019-07-01 Socken SFO 10
...
2019-07-11 Socken SFO 30
2019-02-01 Schuhe ORD 50
...
2019-07-01 Schuhe ORD 75
...
2019-07-11 Schuhe ORD 60

Die folgende Tabelle zeigt kompatible Datenaufzeichnungsfrequenzen für Zielzeitreihen und zugehörige Zeitreihen, die mit einer wöchentlichen Granularität prognostiziert werden sollen. Da Daten in einem Dataset verwandter Zeitreihen nicht aggregiert werden können, akzeptiert Forecast nur eine Datenfrequenzen verwandter Zeitreihen, die mit der gewählten Prognosegranularität übereinstimmen.

Zieleingabedaten (Häufigkeit) Verwandte Zeitreihen (Häufigkeit) Prognose der Granularität Unterstützt von Forecast?
Täglich Wöchentlich Wöchentlich Ja
Wöchentlich Wöchentlich Wöchentlich Ja
Wöchentlich Wöchentlich Ja
Täglich Täglich Wöchentlich Nein
Anmerkung

Informationen zum Upgrade eines vorhandenen Prädiktors auf AutoRedictor finden Sie unterAktualisieren auf AutoPredictor

Wenn Sie einen Legacy-Prädiktor verwenden, können Sie ein Dataset verwandter Zeitreihen verwenden, wenn Sie einen Prädiktor mit demCNN-QR,DeepAR+, undProphetAlgorithmen. NPTS,ARIMA, undETSakzeptieren keine zugehörigen Zeitreihendaten.

In der folgenden Tabelle werden die Arten verwandter Zeitreihen, die jeder Amazon-Forecast-Algorithmus akzeptiert.

CNN-QR DeepAR+ Prophet NPTS ARIMA ETS

Historische verwandte Zeitreihen

Zukunftsorientierte Zeitreihen

Wenn Sie AutoML verwenden, können Sie sowohl historische als auch zukunftsgerichtete Zeitreihendaten bereitstellen, und Forecast verwendet diese Zeitreihen nur, falls zutreffend.

Wenn Sie angebenzukunftsorientiertverwandte Zeitreihendaten, Forecast verwendet die zugehörigen Daten mit CNN-QR, DeePar+ und Prophet und verwendet die zugehörigen Daten nicht mit NPTS, ARIMA und ETS. Falls angegebenhistorischverwandte Zeitreihendaten, Forecast wird die zugehörigen Daten mit CNN-QR verwenden und die zugehörigen Daten nicht mit DeePar+, Prophet, NPTS, ARIMA und ETS verwenden.