Vordefinierte Dataset-Domänen und Dataset-Typen - Amazon Forecast

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Vordefinierte Dataset-Domänen und Dataset-Typen

Um einen Predictor zu schulen, erstellen Sie ein oder mehrere Datasets, fügen sie einer Dataset-Gruppe hinzu und stellen die Dataset-Gruppe für die Schulung bereit.

Für jedes Dataset, das Sie erstellen, ordnen Sie eine Dataset-Domäne und einen Dataset-Typ zu. Eine Dataset-Domäne gibt ein vordefiniertes Dataset-Schema für einen allgemeinen Anwendungsfall an und wirkt sich nicht auf Modellalgorithmen oder Hyperparameter aus.

Amazon Forecast unterstützt die folgenden Dataset-Domänen:

Jede Domäne kann ein bis drei Dataset-Typen haben. Die für eine Domäne erstellten Dataset-Typen basieren auf dem verwendeten Datentyp sowie den Daten, die Sie für die Schulung verwenden möchten.

Jede Domäne benötigt ein Ziel-Zeitreihen-Dataset und unterstützt optional den Dataset-Typ der verwandten Zeitreihen oder den Artikel-Metadaten-Dataset-Typ.

Die Dataset-Typen sind:

  • Ziel-Zeitreihen: Der einzige erforderliche Dataset-Typ. Dieser Typ definiert das Zielfeld, für das Sie Prognosen generieren möchten. Wenn Sie beispielsweise eine Prognose für die Verkäufe für eine Produktreihe erstellen möchten, müssen Sie für jedes Produkt, für das Sie eine Prognose erstellen möchten, ein Dataset der Zeitreihenverlaufsdaten erstellen. Ebenso können Sie ein Zielzeitreihen-Dataset für Metriken wie Umsatz, Cashflow und Umsatz erstellen, das Sie möglicherweise prognostizieren möchten.

  • Verwandte Zeitreihen — Zeitreihendaten, die im Zusammenhang mit den Ziel-Zeitreihendaten stehen. Beispielsweise steht der Preis in Zusammenhang mit den Produktverkaufsdaten und kann daher als verwandte Zeitreihen angegeben werden.

  • Artikel-Metadaten — Metadaten, die für die Ziel-Zeitreihendaten gelten. Wenn Sie beispielsweise den Umsatz für ein bestimmtes Produkt prognostizieren, sind Attribute des Produkts — wie Marke, Farbe und Genre — Teil der Artikelmetadaten. Bei Prognosen zur EC2-Kapazität für EC2-Instances können die Metadaten die Rechenleistung und den Arbeitsspeicher der Instance-Typen enthalten.

Ihre Eingabedaten müssen für jeden Dataset-Typ bestimmte Pflichtfelder enthalten. Darüber hinaus können Sie optionale Felder einbeziehen, die Ihnen von Amazon Forecast vorgeschlagen werden.

Die folgenden Beispiele zeigen, wie Sie eine Dataset-Domäne und entsprechende Dataset-Typen auswählen.

Beispiel 1: Dataset-Typen in der Domäne RETAIL

Wenn Sie als Einzelhändler eine Prognose zur Nachfrage für bestimmte Artikel erstellen möchten, können Sie die folgenden Datasets in der Domäne RETAIL erstellen:

  • Das Zielzeitenreihen-Dataset wird für die bisheriger Zeitreihendaten zur Nachfrage (Verkäufe) für die einzelnen Artikel (jedes vom Händler verkaufte Produkt) benötigt. In der Domäne RETAIL muss das Dataset für diesen Dataset-Typ die Felder item_id, timestamp und demand enthalten. Das Feld demand ist das Prognoseziel, in der Regel die vom Händler in einer bestimmten Woche oder an einem bestimmten Tag verkaufte Anzahl der Artikel.

  • Optional ein Dataset des Typs der verwandten Zeitreihen. In der Domäne RETAIL kann dieser Typ optional, aber empfohlen, Zeitreihendaten wie price, inventory_onhand und webpage_hits enthalten.

  • Optional ein Dataset vom Artikel-Metadatentyp. In der Domäne RETAIL empfiehlt Amazon Forecast Ihnen, Metadaten zu den Artikeln bereitzustellen, die Sie in Ziel-Zeitreihen angegeben haben, beispielsweise brand, color, category und genre.

Beispiel 2: Dataset-Typen in der Domäne METRICS

Wenn Sie wichtige Kennzahlen für Ihr Unternehmen wie Umsatz, Umsatz und Cashflow prognostizieren möchten, können Sie Amazon Forecast die folgenden Datensätze zur Verfügung stellen:

  • Das Ziel-Zeitreihen-Dataset mit bisherigen Zeitreihendaten für die Metrik, für die Sie eine Prognose erstellen möchten. Wenn Sie an der Vorhersage des Umsatzes aller Geschäftsbereiche in Ihrem Unternehmen interessiert sind, können Sie ein target time series-Dataset mit den Feldern metric, business unit und metric_value erstellen.

  • Wenn Sie über Metadaten für die einzelnen Metriken verfügen, die nicht erforderlich sind, wie category oder location, können Sie Datasets vom Typ der verwandten Zeitreihen und vom Typ der Artikel-Metadaten bereitstellen.

Sie müssen mindestens ein Zielzeitreihen-Dataset bereitstellen, damit Forecast für Ihre Zielmetriken generiert.

Beispiel 3: Dataset-Typen in der Domäne CUSTOM

Die Schulungsdaten für Ihre Prognoseanwendung passen möglicherweise in keine der Amazon Forecast-Domänen. Wählen Sie in diesem Fall die Domäne CUSTOM aus. Sie müssen das Ziel-Zeitreihen-Dataset angeben, können jedoch eigene, benutzerdefinierte Felder hinzufügen.

In der Übung Erste Schritte wird der Stromverbrauch für einen Client prognostiziert. Die Schulungsdaten für den Stromverbrauch passen in keine der Dataset-Domänen, daher wurde die Domäne CUSTOM verwendet. In der Übung wird nur ein Dataset-Typ verwendet, nämlich der Ziel-Zeitreihentyp. Wir ordnen die Datenfelder den für den Dataset-Typ benötigten minimalen Feldern zu.