Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
CNN-QR-Algorithmus
Amazon Forecast CNN-QR, Convolutional Neural Network - Quantile Regression, ist ein proprietärer Algorithmus für maschinelles Lernen zur Prognose von skalaren (eindimensionalen) Zeitreihen mithilfe von kausalen Faltungs-neuronalen Netzwerken (CNNs). Dieser überwachte Lernalgorithmus trainiert ein globales Modell aus einer großen Sammlung von Zeitreihen und verwendet einen Quantildecoder, um probabilistische Vorhersagen zu treffen.
Themen
Erste Schritte mit CNN-QR
Sie können einen Prädiktor mit CNN-QR auf zwei Arten trainieren:
-
Wählen Sie den CNN-QR-Algorithmus manuell aus.
-
Auswahl von AutoML (CNN-QR ist Teil von AutoML).
Wenn Sie sich nicht sicher sind, welchen Algorithmus Sie verwenden sollen, empfehlen wir die Auswahl von AutoML, und Forecast wählt CNN-QR aus, wenn es sich um den genauesten Algorithmus für Ihre Daten handelt. Um zu sehen, ob CNN-QR als das genaueste Modell ausgewählt wurde, verwenden Sie entweder dieDescribePredictorAPI oder wählen Sie den Prädiktornamen in der Konsole aus.
Hier sind einige wichtige Anwendungsfälle für CNN-QR:
-
Forecast mit großen und komplexen Datensätzen- CNN-QR funktioniert am besten, wenn es mit großen und komplexen Datensätzen trainiert wird. Das neuronale Netzwerk kann über viele Datensätze hinweg lernen, was nützlich ist, wenn Sie verwandte Zeitreihen und Elementmetadaten haben.
-
Forecast mit historischen verwandten Zeitreihen- CNN-QR benötigt keine zugehörigen Zeitreihen, um Datenpunkte innerhalb des Prognosehorizonts zu enthalten. Diese zusätzliche Flexibilität ermöglicht es Ihnen, eine breitere Palette verwandter Zeitreihen- und Artikelmetadaten wie Artikelpreis, Ereignisse, Webmetriken und Produktkategorien einzubeziehen.
-
Prognose-Sonderfälle- CNN-QR kann für Kaltstartszenarien verwendet werden, in denen nur wenige oder keine historischen Daten vorhanden sind. Elementmetadaten und verwandte Zeitreihen können verwendet werden, um Kaltstartprognosen zu generieren. Indem Sie verschiedene Versionen Ihrer zugehörigen Zeitreihendaten mit Ihrem geschulten Modell verwenden, können Sie Was-wenn-Analysen für verschiedene Szenarien und Gegenfakte durchführen.
So funktioniert CNN-QR
CNN-QR ist einsequence-to-sequence(Seq2Seq) -Modell für probabilistische Prognosen, das testet, wie gut eine Vorhersage die Decodierungssequenz rekonstruiert, abhängig von der Kodierungssequenz.
Der Algorithmus ermöglicht verschiedene Funktionen in den Codierungs- und Dekodierungssequenzen, sodass Sie eine verwandte Zeitreihe im Encoder verwenden und sie aus dem Decoder weglassen können (und umgekehrt). Standardmäßig werden verwandte Zeitreihen mit Datenpunkten im Prognosehorizont sowohl im Encoder als auch im Decoder enthalten. Zugehörige Zeitreihen ohne Datenpunkte im Prognosehorizont werden nur in den Encoder aufgenommen.
CNN-QR führt eine quantile Regression durch, wobei ein hierarchischer kausaler CNN als lernbarer Feature-Extraktor dient.
Um das Erlernen zeitabhängiger Muster wie Spitzen an Wochenenden zu vereinfachen, erstellt CNN-QR automatisch Funktionszeitreihen basierend auf der Granularität der Zeitreihen. CNN-QR erstellt beispielsweise zwei Feature-Zeitreihen (day-of-monthundday-of-year) bei wöchentlicher Zeitreihenfrequenz. Der Algorithmus verwendet diese abgeleiteten Funktionszeitreihen zusammen mit den benutzerdefinierten Funktionszeitreihen, die während der Schulung und Ableitung bereitgestellt werden. Im folgenden Beispiel wird eine Ziel-Zeitreihe angezeigt,zi,t
, sowie zwei abgeleitete Zeitreihen-Funktionen:ui,1,t
repräsentiert die Stunde des Tages undui,2,t
repräsentiert den Wochentag.
CNN-QR enthält diese Funktionszeitreihen automatisch basierend auf der Datenfrequenz und der Größe der Trainingsdaten. In der folgenden Tabelle sind die Funktionen aufgeführt, die für jede unterstützte Basiszeithäufigkeit abgeleitet werden können.
Häufigkeit der Zeitreihe | Abgeleitete Funktionen |
---|---|
Minute | minute-of-hour, hour-of-day, day-of-week, day-of-month, day-of-year |
Stunde | hour-of-day, day-of-week, day-of-month, day-of-year |
Tag | day-of-week, day-of-month, day-of-year |
Woche | day-of-month, week-of-year |
Monat | month-of-year |
Während des Trainings besteht jede Zeitreihe im Schulungs-Dataset aus zwei benachbarten Kontext- und Prognosefenstern mit festen vordefinierten Längen. Dies ist in der folgenden Abbildung dargestellt, in der das Kontextfenster grün dargestellt wird und das Prognosefenster blau dargestellt wird.
Sie können ein Modell verwenden, das in einem bestimmten Schulungssatz geschult wurde, um Vorhersagen für Zeitreihen im Schulungsset und für andere Zeitreihen zu erstellen. Das Schulungs-Dataset besteht aus einer Ziel-Zeitreihe, die mit einer Liste verwandter Zeitreihen und Artikel-Metadaten verknüpft sein kann.
In der folgenden Abbildung wird gezeigt, wie dies für ein Element eines Schulungs-Datasets funktioniert, das voni
aus. Der Schulungs-Dataset besteht aus einer Ziel-Zeitreihe,zi,t
und zwei zugehörige verwandte Zeitreihen,xi,1,t
undxi,2,t
aus. Die erste verwandte Zeitreihe,xi,1,t
, ist eine zukunftsgerichtete Zeitreihe, und die zweitexi,2,t
, ist eine historische Zeitreihe.

CNN-QR lernt über die Zielzeitreihen hinweg,zi,t
und die dazugehörigen Zeitreihenxi,1,t
undxi,2,t
, um Vorhersagen im Prognosefenster zu generieren, dargestellt durch die orangefarbene Linie.
Verwenden verwandter Daten mit CNN-QR
CNNQR unterstützt sowohl historische als auch zukunftsgerichtete, verwandte Zeitreihen-Datasets. Wenn Sie einen zukunftsgerichteten, verwandten Zeitreihendatensatz angeben, wird jeder fehlende Wert mit derZukünftige Füllmethodeaus. Weitere Informationen zu historischen und zukunftsgerichteten verwandten Zeitreihen finden Sie unterVerwenden von Datasets verwandter Zeitreihenaus.
Sie können auch Elementmetadaten-Datasets mit CNN-QR verwenden. Dies sind Datensätze mit statischen Informationen zu den Elementen in Ihrer Zielzeitreihe. Elementmetadaten sind besonders nützlich für Kaltstart-Prognoseszenarien, in denen es wenig bis keine historischen Daten gibt. Weitere Informationen zu Artikel-Metadaten erhalten Sie unterArtikel-Metadaten.
CNN-QR-Hyperparameter
Amazon Forecast optimiert CNN-QR-Modelle für ausgewählte Hyperparameter. Wenn Sie CNN-QR manuell auswählen, haben Sie die Möglichkeit, Trainingsparameter für diese Hyperparameter zu übergeben. In der folgenden Tabelle werden die abstimmbaren Hyperparameter des CNN-QR-Algorithmus aufgeführt.
Parametername | Werte | Beschreibung |
---|---|---|
context_length |
|
Die Anzahl der Zeitpunkte, die das Modell liest, bevor Vorhersagen erfolgt. Normalerweise hat CNN-QR größere Werte für Wenn der Wert für |
use_related_data |
|
Bestimmt, welche Arten von verwandten Zeitreihendaten in das Modell aufgenommen werden sollen. Wählen Sie eine von vier Optionen aus:
|
use_item_metadata |
|
Bestimmt, ob das Modell Elementmetadaten enthält. Wählen Sie eine von zwei Optionen aus:
|
epochs |
|
Die maximale Anzahl abgeschlossener Durchläufe durch die Schulungsdaten. Kleinere Datensätze benötigen mehr Epochen. Für große Werte von |
Hyperparameter-Optimierung (HPO)
Hyperparameter-Optimierung (HPO) besteht darin, die optimalen Hyperparameter-Werte für ein bestimmtes Lernziel auszuwählen. Mit Forecast können Sie diesen Prozess auf zwei Arten automatisieren:
-
Die Wahl von AutoML und HPO wird automatisch für CNN-QR ausgeführt.
-
CNN-QR manuell auswählen und einstellen
PerformHPO = TRUE
aus.
Zusätzliche verwandte Zeitreihen und Artikelmetadaten verbessern nicht immer die Genauigkeit Ihres CNN-QR-Modells. Wenn Sie AutoML ausführen oder HPO aktivieren, testet CNN-QR die Genauigkeit Ihres Modells mit und ohne die bereitgestellten zugehörigen Zeitreihen- und Elementmetadaten und wählt das Modell mit höchster Genauigkeit aus.
Amazon Forecast optimiert automatisch die folgenden drei Hyperparameter während des HPO und liefert Ihnen die endgültig geschulten Werte:
-
context_length- bestimmt, wie weit in die Vergangenheit das Netzwerk sehen kann. Der HPO-Prozess legt automatisch einen Wert für
context_length
das maximiert die Modellgenauigkeit unter Berücksichtigung der Trainingszeit. -
use_related_data- bestimmt, welche Formen verwandter Zeitreihendaten in Ihr Modell aufgenommen werden sollen. Der HPO-Prozess prüft automatisch, ob Ihre zugehörigen Zeitreihendaten das Modell verbessern, und wählt die optimale Einstellung aus.
-
use_item_metadaten- bestimmt, ob Elementmetadaten in Ihr Modell aufgenommen werden sollen. Der HPO-Prozess prüft automatisch, ob Ihre Artikelmetadaten das Modell verbessern, und wählt die optimale Einstellung aus.
Wennuse_related_data
wird auf gesetztNONE
oderHISTORICAL
Wenn dieHoliday
Ergänzungsmerkmal wird ausgewählt, was bedeutet, dass die Einbeziehung von Urlaubsdaten die Modellgenauigkeit nicht verbessert.
Sie können die HPO-Konfiguration fürcontext_length
Hyperparameter wenn Sie einstellenPerformHPO = TRUE
während der manuellen Auswahl. Sie können jedoch keinen Aspekt der HPO-Konfiguration ändern, wenn Sie AutoML wählen. Weitere Informationen zur HPO-Konfiguration erhalten Sie in derIntergerParameterBereichAPI.
Tipps und bewährte Methoden
Vermeiden Sie große Werte fürForecastHorizon- Verwendung von Werten über 100 für denForecastHorizon
erhöht die Trainingszeit und kann die Modellgenauigkeit reduzieren. Wenn Sie Prognosen für einen Zeitpunkt weiter in der Zukunft erstellen wollen, sollten Sie Daten für eine höhere Häufigkeit aggregieren. Verwenden Sie z. B. 5min
statt 1min
.
CNNs ermöglichen eine höhere Kontextlänge- Mit CNN-QR können Sie dascontext_length
etwas höher als bei DeePar+, da CNNs im Allgemeinen effizienter sind als RNNs.
Feature-Engineering verwandter Daten- Experimentieren Sie beim Training Ihres Modells mit verschiedenen Kombinationen von verwandten Zeitreihen und Artikelmetadaten und beurteilen Sie, ob die zusätzlichen Informationen die Genauigkeit verbessern. Verschiedene Kombinationen und Transformationen verwandter Zeitreihen und Artikelmetadaten liefern unterschiedliche Ergebnisse.
CNN-QR prognostiziert nicht im mittleren Quantil— Wenn du eingestellt hastForecastTypes
zumean
mit dem CreateForecastAPI, Prognosen werden stattdessen im mittleren Quantil (0.5
oderP50
) enthalten.
Prognose für Kaltstart-Artikel— Ein globales Modell wie CNN-QR lernt über Ziel-Zeitreihen, verwandte Zeitreihen und Artikel-Metadaten hinweg, wodurch es für Kaltstartszenarien geeignet ist. CNN-QR kann die Nachfrage nach neuen Artikeln und SKUs prognostizieren, die ähnliche Merkmale wie die anderen Artikel mit historischen Daten aufweisen. Follow diesBeispiel-Notebook
Was wäre wenn Analyse— Durch die Verwendung verschiedener Versionen Ihrer historischen und zukunftsorientierten Zeitreihendaten mit Ihrem geschulten CNN-QR-Modell können Sie Prognosen für verschiedene Szenarien und Gegenfakte erstellen. Zum Beispiel können Sie die Nachfrage nach einem Produkt mit und ohne Werbeaktion prognostizieren. Follow diesBeispiel-Notebook