DeepAR-Hyperparameter - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

DeepAR-Hyperparameter

Name des Parameters Beschreibung
context_length

Die Anzahl der Zeitpunkte, die dem Modell zur Verfügung gestellt werden, bevor die Prognose erfolgt. Der Wert für diesen Parameter sollte in etwa prediction_length entsprechen. Das Modell erhält zudem verzögerte Eingaben vom Ziel, sodass context_length viel geringer sein kann als typische Saisonabhängigkeiten. Beispielsweise kann für eine tägliche Zeitreihe eine jährliche Saisonabhängigkeit vorliegen. Das Modell bindet dann automatisch eine Verzögerung von einem Jahr ein, folglich kann die Kontextlänge weniger als ein Jahr betragen. Die vom Modell ausgewählten Verzögerungswerte hängen von der Frequenz der Zeitreihe ab. Verzögerungswerte für die Frequenz "Täglich" sind beispielsweise vorherige Woche, zwei Wochen, drei Wochen, vier Wochen und Jahr.

Erforderlich

Gültige Werte: Positive Ganzzahl

epochs

Die maximale Anzahl von Durchläufen der Trainingsdaten. Der optimale Wert hängt von Ihrer Datengröße und Lernrate ab. Weitere Informationen finden Sie auch unter early_stopping_patience. Typische Werte liegen zwischen 10 und 1000.

Erforderlich

Gültige Werte: Positive Ganzzahl

prediction_length

Die Anzahl der Zeitschritte, für deren Prognose das Modell geschult wurde. Dies wird auch als Prognosehorizont bezeichnet. Das geschulte Modell generiert stets Prognosen mit dieser Länge. Längere Prognosen kann das Modell nicht erstellen. Der Wert prediction_length wird beim Schulen eines Modells festgelegt und kann später nicht mehr geändert werden.

Erforderlich

Gültige Werte: Positive Ganzzahl

time_freq

Die Granularität der Zeitreihe im Dataset. Verwenden Sie time_freq zur Auswahl geeigneter Datumsfunktionen und Verzögerungen. Das Modell unterstützt die folgenden Basishäufigkeiten. Außerdem unterstützt es ein Vielfaches dieser Basishäufigkeiten. Beispielsweise gibt 5min eine Häufigkeit von 5 Minuten an.

  • M: monatlich

  • W: wöchentlich

  • D: täglich

  • H: stündlich

  • min: jede Minute

Erforderlich

Gültige Werte: Eine Ganzzahl, gefolgt von M, WDH oder min. Z.B. 5min.

cardinality

Bei Verwendung der kategorischen Features (cat) ist cardinality ein Array, das die Anzahl von Kategorien (Gruppen) pro kategorischem Feature angibt. Legen Sie diesen Wert auf auto fest, um die Kardinalität aus den Daten abzuleiten. Der auto-Modus funktioniert auch, wenn keine kategorischen Features im Dataset verwendet werden. Dies ist die empfohlene Einstellung für den Parameter.

Legen Sie die Kardinalität auf ignore fest, um zu erzwingen, dass DeepAR keine kategorischen Features verwendet, auch wenn sie in den Daten vorhanden sind.

Zum Ausführen einer zusätzlichen Datenvalidierung kann dieser Parameter auf den Istwert festgelegt werden. Beispiel: Wenn zwei kategorische Features bereitgestellt werden und die erste 2 und die zweite 3 mögliche Werte hat, legen Sie diesen Wert auf [2, 3] fest.

Weitere Informationen zur Verwendung der kategorischen Features finden Sie im Datenabschnitt auf der Seite für DeepAR der Hauptdokumentation.

Optional

Gültige Werte: auto, ignore, Array von positive Ganzzahlen, leere Zeichenfolge oder

Standardwert: auto

dropout_rate

Die Ausfallrate, die während der Schulung zu verwenden ist. Das Modell verwendet eine Zoneout-Regularisierung. Bei jedem Durchlauf wird eine zufällige Teilmenge ausgeblendeter Neuronen nicht aktualisiert. Typische Werte sind unter 0,2.

Optional

Gültige Werte: Gleitkommazahl..

Standardwert: 0.1

early_stopping_patience

Ist dieser Parameter gesetzt, wird die Schulung gestoppt, wenn keine Fortschritte innerhalb der festgelegten Anzahl von epochs zu verzeichnen ist. Das Modell mit der niedrigsten Verlustrate wird als endgültiges Modell zurückgegeben.

Optional

Gültige Werte: Ganzzahl

embedding_dimension

Die Größe des pro kategorischem Features gelernten eingebetteten Vektors (für alle kategorischen Features wird derselbe Wert verwendet).

Das DeepAR-Modell kann Zeitreihenmuster auf Gruppenebene lernen, sofern eine kategorische Gruppenfunktion angegeben wird. Dazu lernt das Modell einen eingebetteten Vektor der Größe embedding_dimension für jede Gruppe und erfasst die häufigen Eigenschaften aller Zeitreihen in der Gruppe. Bei einem höheren embedding_dimension-Wert kann das Modell komplexere Muster erfassen. Da durch eine Erhöhung von embedding_dimension auch die Anzahl von Parametern im Modell steigt, werden mehr Trainingsdaten zum Lernen dieser Parameter benötigt. Typische Werte für diesen Parameter sind zwischen 10 und 100.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 10

learning_rate

Die Lernrate in der Schulung. Typische Werte liegen zwischen 1e-4 und 1e-1.

Optional

Gültige Werte: Gleitkommazahl..

Standardwert: 1e-3

likelihood

Das Modell generiert eine probabilistische Prognose und liefert Quantile für Verteilung und Rückgabe der Stichprobe. Wählen Sie abhängig von Ihren Daten eine geeignete Wahrscheinlichkeit (Stördatenmodell) aus, die für Unsicherheitsschätzungen verwendet wird. Folgende Wahrscheinlichkeiten sind auswählbar:

  • Gaußsche: Verwendung für reellwertige Daten.

  • Beta: Verwendung für reellwertige Ziele zwischen 0 und 1 inklusive.

  • Negativ-binomial: Verwendung für Zähldaten (positive Ganzzahlen).

  • Studentsche-T: Eine Alternative zu reellwertigen Daten, die gut für stoßweise Daten geeignet ist.

  • Deterministisch-L1: Ein Verlustfunktion, die keine Unsicherheit einschätzt und nur eine Punktprognose lernt.

Optional

Gültige Werte: Entweder Gaußsche, Beta, Negativ-binomial, Studentsche-T oder Deterministisch-L1.

Standardwert: student-T

mini_batch_size

Die Größe der im Rahmen der Schulung verwendeten Mini-Stapel. Typische Werte liegen zwischen 32 und 512.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 128

num_cells

Die Anzahl von Zellen, die in den ausgeblendeten Layern des rekurrenten neuronalen Netzwerks (RNN) verwendet werden sollen. Typische Werte liegen zwischen 30 und 100.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 40

num_dynamic_feat

Anzahl von dynamic_feat in den Daten. Legen Sie diesen Wert auf auto fest, um die Anzahl von dynamischen Funktionen aus den Daten abzuleiten. Der auto-Modus funktioniert auch, wenn keine dynamischen Funktionen im Dataset verwendet werden. Dies ist die empfohlene Einstellung für den Parameter.

Legen Sie num_dynamic_feat auf ignore fest, um zu erzwingen, dass DeepAR keine dynamischen Funktionen verwendet, auch wenn sie in den Daten vorhanden sind.

Zum Ausführen einer zusätzlichen Datenvalidierung kann dieser Parameter auf den tatsächlichen Ganzzahlwert festgelegt werden. Wenn z. B. zwei dynamische Funktionen bereitgestellt werden, legen Sie diesen Wert auf 2 fest.

Optional

Gültige Werte: auto, ignore, positive Ganzzahl oder leere Zeichenfolge

Standardwert: auto

num_eval_samples

Die Anzahl von Stichproben, die pro Zeitreihe zur Berechnung der Test-Genauigkeitsmetriken verwendet werden. Dieser Parameter hat keinen Einfluss auf die Schulung oder das endgültige Modell. Das Modell kann insbesondere mit einer anderen Anzahl von Stichproben abgefragt werden. Dieser Parameter wirkt sich nur auf die gemeldeten Genauigkeitswerte im Testkanal nach der Schulung aus. Kleinere Werte führen zu einer schnelleren Auswertung, die Auswertungsbewertungen sind in der Regel jedoch schlechter und ungenauer. Bei einer Auswertung mit höheren Quantilen wie 0,95 sollte die Anzahl von Auswertungsstichproben ggf. erhöht werden.

Optional

Gültige Werte: Ganzzahl

Standardwert: 100

num_layers

Die Anzahl von ausgeblendeten Layers im RNN. Typische Werte liegen zwischen 1 und 4.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 2

test_quantiles

Quantile, für die der Quantilverlust im Testkanal berechnet werden soll

Optional

Gültige Werte: Array von Gleitkommazahlen

Standardwert: [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]