CNN-QR-Algorithmus - Amazon Forecast

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

CNN-QR-Algorithmus

Amazon Forecast CNN-QR, Convolutional Neural Network - Quantile Regression, ist ein proprietärer Algorithmus für maschinelles Lernen zur Prognose von skalaren (eindimensionalen) Zeitreihen mithilfe von kausalen Faltungs-neuronalen Netzwerken (CNNs). Dieser überwachte Lernalgorithmus trainiert ein globales Modell aus einer großen Sammlung von Zeitreihen und verwendet einen Quantildecoder, um probabilistische Vorhersagen zu treffen.

Erste Schritte mit CNN-QR

Sie können einen Prädiktor mit CNN-QR auf zwei Arten trainieren:

  1. Wählen Sie den CNN-QR-Algorithmus manuell aus.

  2. Auswahl von AutoML (CNN-QR ist Teil von AutoML).

Wenn Sie sich nicht sicher sind, welchen Algorithmus Sie verwenden sollen, empfehlen wir die Auswahl von AutoML, und Forecast wählt CNN-QR aus, wenn es sich um den genauesten Algorithmus für Ihre Daten handelt. Um zu sehen, ob CNN-QR als das genaueste Modell ausgewählt wurde, verwenden Sie entweder dieDescribePredictorAPI oder wählen Sie den Prädiktornamen in der Konsole aus.

Hier sind einige wichtige Anwendungsfälle für CNN-QR:

  • Forecast mit großen und komplexen Datensätzen- CNN-QR funktioniert am besten, wenn es mit großen und komplexen Datensätzen trainiert wird. Das neuronale Netzwerk kann über viele Datensätze hinweg lernen, was nützlich ist, wenn Sie verwandte Zeitreihen und Elementmetadaten haben.

  • Forecast mit historischen verwandten Zeitreihen- CNN-QR benötigt keine zugehörigen Zeitreihen, um Datenpunkte innerhalb des Prognosehorizonts zu enthalten. Diese zusätzliche Flexibilität ermöglicht es Ihnen, eine breitere Palette verwandter Zeitreihen- und Artikelmetadaten wie Artikelpreis, Ereignisse, Webmetriken und Produktkategorien einzubeziehen.

  • Prognose-Sonderfälle- CNN-QR kann für Kaltstartszenarien verwendet werden, in denen nur wenige oder keine historischen Daten vorhanden sind. Elementmetadaten und verwandte Zeitreihen können verwendet werden, um Kaltstartprognosen zu generieren. Indem Sie verschiedene Versionen Ihrer zugehörigen Zeitreihendaten mit Ihrem geschulten Modell verwenden, können Sie Was-wenn-Analysen für verschiedene Szenarien und Gegenfakte durchführen.

So funktioniert CNN-QR

CNN-QR ist einsequence-to-sequence(Seq2Seq) -Modell für probabilistische Prognosen, das testet, wie gut eine Vorhersage die Decodierungssequenz rekonstruiert, abhängig von der Kodierungssequenz.

Der Algorithmus ermöglicht verschiedene Funktionen in den Codierungs- und Dekodierungssequenzen, sodass Sie eine verwandte Zeitreihe im Encoder verwenden und sie aus dem Decoder weglassen können (und umgekehrt). Standardmäßig werden verwandte Zeitreihen mit Datenpunkten im Prognosehorizont sowohl im Encoder als auch im Decoder enthalten. Zugehörige Zeitreihen ohne Datenpunkte im Prognosehorizont werden nur in den Encoder aufgenommen.

CNN-QR führt eine quantile Regression durch, wobei ein hierarchischer kausaler CNN als lernbarer Feature-Extraktor dient.

Um das Erlernen zeitabhängiger Muster wie Spitzen an Wochenenden zu vereinfachen, erstellt CNN-QR automatisch Funktionszeitreihen basierend auf der Granularität der Zeitreihen. CNN-QR erstellt beispielsweise zwei Feature-Zeitreihen (day-of-monthundday-of-year) bei wöchentlicher Zeitreihenfrequenz. Der Algorithmus verwendet diese abgeleiteten Funktionszeitreihen zusammen mit den benutzerdefinierten Funktionszeitreihen, die während der Schulung und Ableitung bereitgestellt werden. Im folgenden Beispiel wird eine Ziel-Zeitreihe angezeigt,zi,t, sowie zwei abgeleitete Zeitreihen-Funktionen:ui,1,trepräsentiert die Stunde des Tages undui,2,trepräsentiert den Wochentag.


                Abbild: CNN-QR mit abgeleiteten Funktionen für Zeitfrequenzen.

CNN-QR enthält diese Funktionszeitreihen automatisch basierend auf der Datenfrequenz und der Größe der Trainingsdaten. In der folgenden Tabelle sind die Funktionen aufgeführt, die für jede unterstützte Basiszeithäufigkeit abgeleitet werden können.

Häufigkeit der Zeitreihe Abgeleitete Funktionen
Minute minute-of-hour, hour-of-day, day-of-week, day-of-month, day-of-year
Stunde hour-of-day, day-of-week, day-of-month, day-of-year
Tag day-of-week, day-of-month, day-of-year
Woche day-of-month, week-of-year
Monat month-of-year

Während des Trainings besteht jede Zeitreihe im Schulungs-Dataset aus zwei benachbarten Kontext- und Prognosefenstern mit festen vordefinierten Längen. Dies ist in der folgenden Abbildung dargestellt, in der das Kontextfenster grün dargestellt wird und das Prognosefenster blau dargestellt wird.

Sie können ein Modell verwenden, das in einem bestimmten Schulungssatz geschult wurde, um Vorhersagen für Zeitreihen im Schulungsset und für andere Zeitreihen zu erstellen. Das Schulungs-Dataset besteht aus einer Ziel-Zeitreihe, die mit einer Liste verwandter Zeitreihen und Artikel-Metadaten verknüpft sein kann.

In der folgenden Abbildung wird gezeigt, wie dies für ein Element eines Schulungs-Datasets funktioniert, das voniaus. Der Schulungs-Dataset besteht aus einer Ziel-Zeitreihe,zi,tund zwei zugehörige verwandte Zeitreihen,xi,1,tundxi,2,taus. Die erste verwandte Zeitreihe,xi,1,t, ist eine zukunftsgerichtete Zeitreihe, und die zweitexi,2,t, ist eine historische Zeitreihe.


                Abbild: CNN-QR mit historischen und zukunftsorientierten verwandten Zeitreihen

CNN-QR lernt über die Zielzeitreihen hinweg,zi,tund die dazugehörigen Zeitreihenxi,1,tundxi,2,t, um Vorhersagen im Prognosefenster zu generieren, dargestellt durch die orangefarbene Linie.

Verwenden verwandter Daten mit CNN-QR

CNNQR unterstützt sowohl historische als auch zukunftsgerichtete, verwandte Zeitreihen-Datasets. Wenn Sie einen zukunftsgerichteten, verwandten Zeitreihendatensatz angeben, wird jeder fehlende Wert mit derZukünftige Füllmethodeaus. Weitere Informationen zu historischen und zukunftsgerichteten verwandten Zeitreihen finden Sie unterVerwenden von Datasets verwandter Zeitreihenaus.

Sie können auch Elementmetadaten-Datasets mit CNN-QR verwenden. Dies sind Datensätze mit statischen Informationen zu den Elementen in Ihrer Zielzeitreihe. Elementmetadaten sind besonders nützlich für Kaltstart-Prognoseszenarien, in denen es wenig bis keine historischen Daten gibt. Weitere Informationen zu Artikel-Metadaten erhalten Sie unterArtikel-Metadaten.

CNN-QR-Hyperparameter

Amazon Forecast optimiert CNN-QR-Modelle für ausgewählte Hyperparameter. Wenn Sie CNN-QR manuell auswählen, haben Sie die Möglichkeit, Trainingsparameter für diese Hyperparameter zu übergeben. In der folgenden Tabelle werden die abstimmbaren Hyperparameter des CNN-QR-Algorithmus aufgeführt.

Parametername Werte Beschreibung
context_length
Zulässige Werte

Positive Ganzzahlen

Gültiger Bereich

10 bis 500

Typische Werte

2 *ForecastHorizonbis 12 *ForecastHorizon

HPO optimierbar

Ja

Die Anzahl der Zeitpunkte, die das Modell liest, bevor Vorhersagen erfolgt. Normalerweise hat CNN-QR größere Werte fürcontext_lengthals DeePar+, weil CNN-QR keine Verzögerungen verwendet, um weitere historische Daten zu betrachten.

Wenn der Wert fürcontext_lengthbefindet sich außerhalb eines vordefinierten Bereichs, CNN-QR setzt automatisch den Standardwertcontext_lengthauf einen angemessenen Wert.

use_related_data
Zulässige Werte

ALL

NONE

HISTORICAL

FORWARD_LOOKING

Standardwert

ALL

HPO optimierbar

Ja

Bestimmt, welche Arten von verwandten Zeitreihendaten in das Modell aufgenommen werden sollen.

Wählen Sie eine von vier Optionen aus:

  • ALL: Schließe alle bereitgestellten verwandten Zeitreihen ein.

  • NONE: Schließt alle bereitgestellten verwandten Zeitreihen aus.

  • HISTORICAL: Schließe nur verwandte Zeitreihen ein, dienichtErstrecken Sie sich in den Prognosehorizont.

  • FORWARD_LOOKING: Schließe nur verwandte Zeitreihen ein, dietunErstrecken Sie sich in den Prognosehorizont.

HISTORICALenthält alle historischen verwandten Zeitreihen undFORWARD_LOOKINGbeinhaltet alle zukunftsgerichteten verwandten Zeitreihen. Sie können keine Teilmenge von auswählenHISTORICALoderFORWARD_LOOKINGverwandte Zeitreihen.

use_item_metadata
Zulässige Werte

ALL

NONE

Standardwert

ALL

HPO optimierbar

Ja

Bestimmt, ob das Modell Elementmetadaten enthält.

Wählen Sie eine von zwei Optionen aus:

  • ALL: Schließt alle bereitgestellten Elementmetadaten ein.

  • NONE: Exlude alle bereitgestellten Elementmetadaten.

use_item_metadataenthält entweder alle bereitgestellten Element-Metadaten oder keine. Sie können keine Teilmenge von Elementmetadaten auswählen.

epochs
Zulässige Werte

Positive Ganzzahlen

Typische Werte

10 bis 1.000

Standardwert

100

HPO optimierbar

Nein

Die maximale Anzahl abgeschlossener Durchläufe durch die Schulungsdaten. Kleinere Datensätze benötigen mehr Epochen.

Für große Werte vonForecastHorizonundcontext_lengtherwägen, Epochen zu verringern, um die Trainingszeit zu verbessern.

Hyperparameter-Optimierung (HPO)

Hyperparameter-Optimierung (HPO) besteht darin, die optimalen Hyperparameter-Werte für ein bestimmtes Lernziel auszuwählen. Mit Forecast können Sie diesen Prozess auf zwei Arten automatisieren:

  1. Die Wahl von AutoML und HPO wird automatisch für CNN-QR ausgeführt.

  2. CNN-QR manuell auswählen und einstellenPerformHPO = TRUEaus.

Zusätzliche verwandte Zeitreihen und Artikelmetadaten verbessern nicht immer die Genauigkeit Ihres CNN-QR-Modells. Wenn Sie AutoML ausführen oder HPO aktivieren, testet CNN-QR die Genauigkeit Ihres Modells mit und ohne die bereitgestellten zugehörigen Zeitreihen- und Elementmetadaten und wählt das Modell mit höchster Genauigkeit aus.

Amazon Forecast optimiert automatisch die folgenden drei Hyperparameter während des HPO und liefert Ihnen die endgültig geschulten Werte:

  • context_length- bestimmt, wie weit in die Vergangenheit das Netzwerk sehen kann. Der HPO-Prozess legt automatisch einen Wert fürcontext_lengthdas maximiert die Modellgenauigkeit unter Berücksichtigung der Trainingszeit.

  • use_related_data- bestimmt, welche Formen verwandter Zeitreihendaten in Ihr Modell aufgenommen werden sollen. Der HPO-Prozess prüft automatisch, ob Ihre zugehörigen Zeitreihendaten das Modell verbessern, und wählt die optimale Einstellung aus.

  • use_item_metadaten- bestimmt, ob Elementmetadaten in Ihr Modell aufgenommen werden sollen. Der HPO-Prozess prüft automatisch, ob Ihre Artikelmetadaten das Modell verbessern, und wählt die optimale Einstellung aus.

Anmerkung

Wennuse_related_datawird auf gesetztNONEoderHISTORICALWenn dieHolidayErgänzungsmerkmal wird ausgewählt, was bedeutet, dass die Einbeziehung von Urlaubsdaten die Modellgenauigkeit nicht verbessert.

Sie können die HPO-Konfiguration fürcontext_lengthHyperparameter wenn Sie einstellenPerformHPO = TRUEwährend der manuellen Auswahl. Sie können jedoch keinen Aspekt der HPO-Konfiguration ändern, wenn Sie AutoML wählen. Weitere Informationen zur HPO-Konfiguration erhalten Sie in derIntergerParameterBereichAPI.

Tipps und bewährte Methoden

Vermeiden Sie große Werte fürForecastHorizon- Verwendung von Werten über 100 für denForecastHorizonerhöht die Trainingszeit und kann die Modellgenauigkeit reduzieren. Wenn Sie Prognosen für einen Zeitpunkt weiter in der Zukunft erstellen wollen, sollten Sie Daten für eine höhere Häufigkeit aggregieren. Verwenden Sie z. B. 5min statt 1min.

CNNs ermöglichen eine höhere Kontextlänge- Mit CNN-QR können Sie dascontext_lengthetwas höher als bei DeePar+, da CNNs im Allgemeinen effizienter sind als RNNs.

Feature-Engineering verwandter Daten- Experimentieren Sie beim Training Ihres Modells mit verschiedenen Kombinationen von verwandten Zeitreihen und Artikelmetadaten und beurteilen Sie, ob die zusätzlichen Informationen die Genauigkeit verbessern. Verschiedene Kombinationen und Transformationen verwandter Zeitreihen und Artikelmetadaten liefern unterschiedliche Ergebnisse.

CNN-QR prognostiziert nicht im mittleren Quantil— Wenn du eingestellt hastForecastTypeszumeanmit dem CreateForecastAPI, Prognosen werden stattdessen im mittleren Quantil (0.5oderP50) enthalten.

Prognose für Kaltstart-Artikel— Ein globales Modell wie CNN-QR lernt über Ziel-Zeitreihen, verwandte Zeitreihen und Artikel-Metadaten hinweg, wodurch es für Kaltstartszenarien geeignet ist. CNN-QR kann die Nachfrage nach neuen Artikeln und SKUs prognostizieren, die ähnliche Merkmale wie die anderen Artikel mit historischen Daten aufweisen. Follow diesBeispiel-NotebookDies sind Ihre ersten Schritte.

Was wäre wenn Analyse— Durch die Verwendung verschiedener Versionen Ihrer historischen und zukunftsorientierten Zeitreihendaten mit Ihrem geschulten CNN-QR-Modell können Sie Prognosen für verschiedene Szenarien und Gegenfakte erstellen. Zum Beispiel können Sie die Nachfrage nach einem Produkt mit und ohne Werbeaktion prognostizieren. Follow diesBeispiel-NotebookDies sind Ihre ersten Schritte.