Datensatz-Richtlinien für Forecast - Amazon Forecast

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Datensatz-Richtlinien für Forecast

Beachten Sie die folgenden Richtlinien, wenn Amazon Forecast Ihren Datensatz nicht importieren kann oder wenn Ihr Datensatz nicht wie erwartet funktioniert.

Zeitstempelformat

Für die Erfassungshäufigkeiten Jahr (YM), Monat (W), Woche (D) und Tag () unterstützt Forecast das yyyy-MM-dd Zeitstempelformat (z. B.2019-08-21) und optional das HH:mm:ss Format (z. B.2019-08-21 15:00:00).

Für die Frequenzen Stunde (H) und Minute (M) unterstützt Forecast nur das yyyy-MM-dd HH:mm:ss Format (zum Beispiel2019-08-21 15:00:00).

Richtlinie: Ändern Sie das Zeitstempelformat für die Sammlungshäufigkeit Ihres Datasets zum unterstützten Format.

Amazon S3 S3-Datei oder Bucket

Wenn Sie einen Datensatz importieren, können Sie entweder den Pfad zu einer CSV- oder Parquet-Datei in Ihrem Amazon Simple Storage Service (Amazon S3) -Bucket angeben, der Ihre Daten enthält, oder den Namen des S3-Buckets, der Ihre Daten enthält. Wenn Sie eine CSV- oder Parquet-Datei angeben, importiert Forecast nur diese Datei. Wenn Sie einen S3-Bucket angeben, importiert Forecast alle CSV- oder Parquet-Dateien im Bucket, bis zu 10.000 Dateien. Wenn Sie mehrere Dateien importieren, indem Sie einen Bucket-Namen angeben, müssen alle CSV- oder Parquet-Dateien dem angegebenen Schema entsprechen.

Richtlinie: Geben Sie eine bestimmte Datei oder einen S3-Bucket mit der folgenden Syntax an:

s3://bucket-name/example-object.csv

s3://bucket-name/example-object.parquet

s3://bucket-name/prefix/

s3://bucket-name

Parquet-Dateien können die Erweiterung .parquet, .parq, .pqt oder gar keine Erweiterung haben.

Vollständige Datensatz-Aktualisierungen

Ihr erster Datensatz-Import ist immer ein vollständiger Import. Bei nachfolgenden Importen kann es sich entweder um vollständige oder inkrementelle Aktualisierungen handeln. Sie müssen die Forecast-API verwenden, um den Importmodus anzugeben.

Bei einer vollständigen Aktualisierung werden alle vorhandenen Daten durch die neu importierten Daten ersetzt. Da Jobs zum Import vollständiger Datensätze nicht aggregiert werden, ist Ihr letzter Datenimport derjenige, der beim Trainieren eines Prädiktors oder beim Generieren einer Prognose verwendet wird.

Richtlinie: Erstellen Sie eine inkrementelle Datensatzaktualisierung, um Ihre neuen Daten an die vorhandenen Daten anzuhängen. Stellen Sie andernfalls sicher, dass Ihr letzter Datensatz-Import alle Daten enthält, die Sie modellieren möchten, und nicht nur die neuen Daten, die seit dem letzten Import gesammelt wurden.

Inkrementelle Datensatzaktualisierungen

Felder wie Zeitstempel, Datenformat, Geolokalisierung usw. werden aus dem aktuell aktiven Datensatz gelesen. Sie müssen diese Informationen nicht in einen inkrementellen Datensatz-Import einbeziehen. Wenn sie enthalten sind, müssen sie mit den ursprünglich angegebenen Werten übereinstimmen.

Richtlinie: Führen Sie einen vollständigen Datensatz-Import durch, um einen dieser Werte zu ändern.

Attributreihenfolge

Die in der Schemadefinition angegebene Reihenfolge der Attribute muss der Spaltenreihenfolge in der CSV- oder Parquet-Datei entsprechen, die Sie importieren. Wenn Sie beispielsweise das erste Attribut timestamp definiert haben, timestamp muss es sich auch um die erste Spalte in der Eingabedatei handeln.

Richtlinie: Stellen Sie sicher, dass die Spalten in der Eingabedatei dieselbe Reihenfolge haben wie die Schemaattribute, die Sie erstellt haben.

Wetterindex

Um den Wetterindex anwenden zu können, müssen Sie ein Geolocation-Attribut in Ihre Zielzeitreihe und alle zugehörigen Zeitreihen-Datasets aufnehmen. Sie müssen auch Zeitzonen für die Zeitstempel Ihrer Zielzeitreihen angeben.

Richtlinie: Stellen Sie sicher, dass Ihre Datensätze ein Geolocation-Attribut enthalten und dass Ihren Zeitstempeln eine Zeitzone zugewiesen ist. Weitere Informationen finden Sie im Wetterindex unter Bedingungen und Einschränkungen.

Dataset-Header

Ein Datensatz-Header in Ihrer Eingabe-CSV kann zu einem Validierungsfehler führen. Wir empfehlen, einen Header für CSV-Dateien wegzulassen.

Lösung: Löschen Sie den Dataset-Header, und versuchen Sie es erneut.

Für Parquet-Dateien ist ein Datensatz-Header erforderlich.

Dataset-Status

Bevor Sie Trainingsdaten mit der CreateDatasetImportJob Operation importieren können, müssen Sie zunächst die Daten Status des Datensatzes importierenACTIVE.

Richtlinie: Verwenden Sie die DescribeDataset-Operation, um den Status des Datasets abzurufen. Wenn die Erstellung oder Aktualisierung des Datasets fehlgeschlagen ist, überprüfen Sie die Formatierung Ihrer Dataset-Datei, und versuchen Sie erneut, sie zu erstellen.

Standard-Dateiformat

Das Standarddateiformat ist CSV.

Dateiformat und Trennzeichen

Forecast unterstützt nur das CSV-Dateiformat (Comma-Separated Values) und das Parquet-Format. Sie können Werte nicht mit Tabulatoren, Leerzeichen, Doppelpunkten oder anderen Zeichen voneinander trennen.

Richtlinie: Konvertieren Sie Ihren Datensatz in das CSV-Format (verwenden Sie nur Kommas als Trennzeichen) oder das Parquet-Format und versuchen Sie erneut, die Datei zu importieren.

Dateiname

Dateinamen müssen mindestens ein alphabetisches Zeichen enthalten. Dateien mit ausschließlich numerischen Namen können nicht importiert werden.

Richtlinie: Benennen Sie Ihre Eingabedatendatei um, sodass sie mindestens ein alphabetisches Zeichen enthält, und versuchen Sie erneut, die Datei zu importieren.

Partitionierte Parquet-Daten

Forecast liest keine partitionierten Parquet-Dateien.

Anforderungen an den Datensatz für Was-wäre-wenn-Analysen

Für Was-wäre-wenn-Analysen sind CSV-Datensätze erforderlich. Die TimeSeriesSelector Ausführung der CreateWhatIfAnalysis Aktion und die TimeSeriesReplacementDataSource Ausführung von Parquet-Dateien werden CreateWhatIfForecast nicht akzeptiert.