CreateDatasetImportJob - Amazon Forecast

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

CreateDatasetImportJob

Importiert Ihre Trainingsdaten in einen Amazon-Forecast-Datensatz. Sie geben den Speicherort Ihrer Trainingsdaten in einem Amazon Simple Storage Service (Amazon S3)-Bucket und den Amazon-Ressourcennamen (ARN) des Datensatzes an, in den Sie die Daten importieren möchten.

Sie müssen ein DataSource Objekt angeben, das eine AWS Identity and Access Management (IAM)-Rolle enthält, die Amazon Forecast annehmen kann, um auf die Daten zuzugreifen, da Amazon Forecast eine Kopie Ihrer Daten erstellt und in einem internen AWS System verarbeitet. Weitere Informationen finden Sie unter Einrichten von Berechtigungen.

Die Trainingsdaten müssen im CSV- oder Parquet-Format vorliegen. Das Trennzeichen muss ein Komma (,) sein.

Sie können den Pfad zu einer bestimmten Datei, dem S3-Bucket oder zu einem Ordner im S3-Bucket angeben. In den letzten beiden Fällen importiert Amazon Forecast alle Dateien bis zum Limit von 10.000 Dateien.

Da Datensatzimporte nicht aggregiert werden, wird Ihr letzter Datensatzimport verwendet, wenn Sie einen Prädiktor trainieren oder eine Prognose generieren. Stellen Sie sicher, dass Ihr letzter Datensatzimport alle Daten enthält, aus denen Sie modellieren möchten, und nicht nur die neuen Daten, die seit dem vorherigen Import gesammelt wurden.

Verwenden Sie die -ListDatasetImportJobsOperation, um eine Liste aller Ihrer Datensatz-Importaufträge abzurufen, die nach bestimmten Kriterien gefiltert sind.

Anforderungssyntax

{ "DatasetArn": "string", "DatasetImportJobName": "string", "DataSource": { "S3Config": { "KMSKeyArn": "string", "Path": "string", "RoleArn": "string" } }, "Format": "string", "GeolocationFormat": "string", "ImportMode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "TimestampFormat": "string", "TimeZone": "string", "UseGeolocationForTimeZone": boolean }

Anforderungsparameter

Die Anforderung akzeptiert die folgenden Daten im JSON-Format.

DatasetArn

Der Amazon-Ressourcenname (ARN) des Amazon-Forecast-Datensatzes, in den Sie Daten importieren möchten.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: arn:([a-z\d-]+):forecast:.*:.*:.+

Erforderlich: Ja

DatasetImportJobName

Der Name für den Datensatz-Importauftrag. Wir empfehlen, den aktuellen Zeitstempel in den Namen aufzunehmen, z. B. 20190721DatasetImport. Dies kann Ihnen helfen, eine ResourceAlreadyExistsException Ausnahme zu vermeiden.

Typ: Zeichenfolge

Längenbeschränkungen: Minimale Länge beträgt 1 Zeichen. Maximale Länge beträgt 63 Zeichen.

Pattern: ^[a-zA-Z][a-zA-Z0-9_]*

Erforderlich: Ja

DataSource

Der Speicherort der zu importierenden Trainingsdaten und eine AWS Identity and Access Management (IAM)-Rolle, die Amazon Forecast für den Zugriff auf die Daten übernehmen kann. Die Trainingsdaten müssen in einem Amazon S3-Bucket gespeichert werden.

Wenn Verschlüsselung verwendet wird, DataSource muss einen AWS Key Management Service (KMS)-Schlüssel enthalten und die IAM-Rolle muss Amazon Forecast die Berechtigung für den Zugriff auf den Schlüssel gewähren. Der KMS-Schlüssel und die IAM-Rolle müssen mit denen übereinstimmen, die im -EncryptionConfigParameter der -CreateDatasetOperation angegeben sind.

Typ: DataSource Objekt

Erforderlich: Ja

Format

Das Format der importierten Daten, CSV oder PARQUET. Der Standardwert lautet CSV.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge von 7.

Pattern: ^CSV|PARQUET$

Erforderlich: Nein

GeolocationFormat

Das Format des Geolocation-Attributs. Das Geolocation-Attribut kann auf zwei Arten formatiert werden:

  • LAT_LONG – Breiten- und Längengrad im Dezimalformat (Beispiel: 47,61_-122,33).

  • CC_POSTALCODE (Nur USA) – der Ländercode (USA), gefolgt von der fünfstelligen Postleitzahl (Beispiel: US_98121).

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: ^[a-zA-Z0-9_]+$

Erforderlich: Nein

ImportMode

Gibt an, ob der Datensatz-Importauftrag ein - FULL oder -INCREMENTALImport ist. Ein FULL Datensatzimport ersetzt alle vorhandenen Daten durch die neu importierten Daten. Ein INCREMENTAL Import hängt die importierten Daten an die vorhandenen Daten an.

Typ: Zeichenfolge

Zulässige Werte: FULL | INCREMENTAL

Erforderlich: Nein

Tags

Die optionalen Metadaten, die Sie auf den Datensatz-Importauftrag anwenden, um die Kategorisierung und Organisation zu erleichtern. Jeder Tag (Markierung) besteht aus einem Schlüssel und einem optionalen Wert, beides können Sie bestimmen.

Die folgenden grundlegenden Einschränkungen gelten für Tags (Markierungen):

  • Maximale Anzahl von Tags pro Ressource – 50.

  • Jeder Tag (Markierung) muss für jede Ressource eindeutig sein. Jeder Tag (Markierung) kann nur einen Wert haben.

  • Maximale Schlüssellänge: 128 Unicode-Zeichen in UTF-8.

  • Maximale Länge des Wertes – 256 Unicode-Zeichen in UTF-8.

  • Wenn Ihr Markierungsschema für mehrere -Services und -Ressourcen verwendet wird, denken Sie daran, dass andere Services möglicherweise Einschränkungen für zulässige Zeichen haben. Allgemein erlaubte Zeichen sind: Buchstaben, Zahlen und Leerzeichen, die in UTF-8 darstellbar sind, und die folgenden Sonderzeichen: + - = . _ : / @.

  • Bei Tag-Schlüsseln und -Werten muss die Groß- und Kleinschreibung beachtet werden.

  • Verwenden Sie nicht aws:, oder eine beliebige Kombination aus Groß- und Kleinbuchstaben als Präfix für SchlüsselAWS:, da es für die AWS Verwendung reserviert ist. Sie können Tag-Schlüssel mit diesem Präfix nicht bearbeiten oder löschen. Werte können dieses Präfix haben. Wenn ein Tag-Wert aws als Präfix hat, der Schlüssel jedoch nicht, betrachtet Forecast ihn als Benutzer-Tag und wird auf das Limit von 50 Tags angerechnet. Tags mit nur dem Schlüsselpräfix aws werden nicht auf Ihre Tags pro Ressourcenlimit angerechnet.

Typ: Array von Tag-Objekten

Array-Mitglieder: Die Mindestanzahl beträgt 0 Elemente. Die maximale Anzahl beträgt 200 Elemente.

Erforderlich: Nein

TimestampFormat

Das Format der Zeitstempel im Datensatz. Das Format, das Sie angeben, hängt von dem ab, das bei der Erstellung des Datensatzes DataFrequency angegeben wurde. Die folgenden Formate werden unterstützt

  • „jjjjjj-MM-TT“

    Für die folgenden Datenfrequenzen: Y, M, W und D

  • "jjjj-MM-tt HH:mm:ss"

    Für die folgenden Datenfrequenzen: H, 30 Min., 15 Min. und 1 Min. und optional für: Y, M, W und D

Wenn das Format nicht angegeben ist, erwartet Amazon Forecast das Format „yyyy-MM-dd HH:mm:ss“.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: ^[a-zA-Z0-9\-\:\.\,\'\s]+$

Erforderlich: Nein

TimeZone

Eine einzelne Zeitzone für jedes Element in Ihrem Datensatz. Diese Option ist ideal für Datensätze mit allen Zeitstempeln innerhalb einer einzigen Zeitzone oder wenn alle Zeitstempel auf eine einzelne Zeitzone normalisiert sind.

Eine vollständige Liste der gültigen Zeitzonennamen finden Sie in der Joda-Time-API.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: ^[a-zA-Z0-9\/\+\-\_]+$

Erforderlich: Nein

UseGeolocationForTimeZone

Leiten Sie Zeitzoneninformationen automatisch aus dem Geolocation-Attribut ab. Diese Option ist ideal für Datensätze, die Zeitstempel in mehreren Zeitzonen enthalten und diese Zeitstempel in Ortszeit ausgedrückt werden.

Typ: Boolesch

Erforderlich: Nein

Antwortsyntax

{ "DatasetImportJobArn": "string" }

Antwortelemente

Wenn die Aktion erfolgreich ist, sendet der Service eine HTTP 200-Antwort zurück.

Die folgenden Daten werden vom Service im JSON-Format zurückgegeben.

DatasetImportJobArn

Der Amazon-Ressourcenname (ARN) des Datensatz-Importauftrags.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: arn:([a-z\d-]+):forecast:.*:.*:.+

Fehler

InvalidInputException

Wir können die Anforderung nicht verarbeiten, da sie einen ungültigen Wert oder einen Wert enthält, der den gültigen Bereich überschreitet.

HTTP Status Code: 400

LimitExceededException

Das Limit für die Anzahl der Ressourcen pro Konto wurde überschritten.

HTTP Status Code: 400

ResourceAlreadyExistsException

Es gibt bereits eine Ressource mit diesem Namen. Versuchen Sie es erneut mit einem anderen Namen.

HTTP Status Code: 400

ResourceInUseException

Die angegebene Ressource wird verwendet.

HTTP Status Code: 400

ResourceNotFoundException

Wir können keine Ressource mit diesem Amazon-Ressourcennamen (ARN) finden. Überprüfen Sie den ARN und versuchen Sie es erneut.

HTTP Status Code: 400

Weitere Informationen finden Sie unter:

Weitere Informationen zur Verwendung dieser API in einem der sprachspezifischen AWS-SDKs finden Sie unter: