CreateDatasetImportJob - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CreateDatasetImportJob

Crée une tâche qui importe les données d'entraînement de votre source de données (un compartiment Amazon S3) vers un ensemble de données Amazon Personalize. Pour autoriser Amazon Personalize à importer les données de formation, vous devez spécifier un rôle de service IAM autorisé à lire depuis la source de données, car Amazon Personalize crée une copie de vos données et les traite en interne. Pour plus d'informations sur l'octroi de l'accès à votre compartiment Amazon S3, consultez Giving Amazon Personalize Access to Amazon S3 Resources.

Si vous avez déjà créé un recommandateur ou déployé une version de solution personnalisée dans le cadre d'une campagne, l'influence des nouveaux enregistrements groupés sur les recommandations dépend du cas d'utilisation du domaine ou de la recette que vous utilisez. Pour plus d'informations, voir Comment les nouvelles données influencent les recommandations en temps réel.

Important

Par défaut, une tâche d'importation de jeu de données remplace toutes les données existantes du jeu de données que vous avez importé en bloc. Pour ajouter de nouveaux enregistrements sans remplacer les données existantes, spécifiez INCREMENTAL pour le mode d'importation de l' CreateDatasetImportJob opération.

Statut

Une tâche d'importation de jeux de données peut se trouver dans l'un des états suivants :

  • CREATE PENDING > CREATE IN_PROGRESS > ACTIVE -ou- CREATE FAILED

Pour connaître le statut de la tâche d'importation DescribeDatasetImportJob, appelez en fournissant le nom de ressource Amazon (ARN) de la tâche d'importation de l'ensemble de données. L'importation d'ensembles de données est terminée quand le statut ACTIVE (ACTIF) apparaît. Si le statut est CREATE FAILED, la réponse inclut une failureReason clé qui décrit la raison de l'échec de la tâche.

Note

L'importation nécessite un certain temps. Vous devez attendre que le statut apparaisse comme ACTIF avant d'entraîner un modèle à l'aide du jeu de données.

Syntaxe de la requête

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "importMode": "string", "jobName": "string", "publishAttributionMetricsToS3": boolean, "roleArn": "string", "tags": [ { "tagKey": "string", "tagValue": "string" } ] }

Paramètres de demande

Cette demande accepte les données suivantes au format JSON.

datasetArn

L'ARN de l'ensemble de données qui reçoit les données importées.

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):personalize:.*:.*:.+

Obligatoire : oui

dataSource

Le compartiment Amazon S3 qui contient les données d'entraînement à importer.

Type : objet DataSource

Obligatoire : oui

importMode

Spécifiez comment ajouter les nouveaux enregistrements à un ensemble de données existant. Le mode d'importation par défaut estFULL. Si vous n'avez pas importé d'enregistrements groupés dans le jeu de données auparavant, vous pouvez uniquement le spécifierFULL.

  • Spécifiez FULL de remplacer toutes les données en bloc existantes dans votre ensemble de données. Les données que vous avez importées individuellement ne sont pas remplacées.

  • Spécifiez INCREMENTAL d'ajouter les nouveaux enregistrements aux données existantes de votre ensemble de données. Amazon Personalize remplace tout enregistrement portant le même identifiant par le nouveau.

Type : chaîne

Valeurs valides : FULL | INCREMENTAL

Obligatoire : non

jobName

Nom de la tâche d'importation de l'ensemble de données.

Type : chaîne

Contraintes de longueur : longueur minimum de 1. Longueur maximum de 63.

Modèle : ^[a-zA-Z0-9][a-zA-Z0-9\-_]*

Obligatoire : oui

publishAttributionMetricsToS3

Si vous avez créé une attribution de métriques, spécifiez si vous souhaitez publier des métriques pour cette tâche d'importation sur Amazon S3

Type : booléen

Obligatoire : non

roleArn

L'ARN du rôle IAM autorisé à lire à partir de la source de données Amazon S3.

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

Obligatoire : oui

tags

Liste des balises à appliquer à la tâche d'importation de l'ensemble de données.

Type : tableau d’objets Tag

Membres du tableau : nombre minimum de 0 élément. Nombre maximum de 200 éléments.

Obligatoire : non

Syntaxe de la réponse

{ "datasetImportJobArn": "string" }

Eléments de réponse

Si l’action aboutit, le service renvoie une réponse HTTP 200.

Les données suivantes sont renvoyées au format JSON par le service.

datasetImportJobArn

L'ARN de la tâche d'importation du jeu de données.

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):personalize:.*:.*:.+

Erreurs

InvalidInputException

Entrez une valeur valide pour le champ ou le paramètre.

Code d’état HTTP : 400

LimitExceededException

La limite du nombre de demandes par seconde a été dépassée.

Code d’état HTTP : 400

ResourceAlreadyExistsException

La ressource spécifiée existe déjà.

Code d’état HTTP : 400

ResourceInUseException

La ressource spécifiée est en cours d'utilisation.

Code d’état HTTP : 400

ResourceNotFoundException

Impossible de trouver la ressource spécifiée.

Code d’état HTTP : 400

TooManyTagsException

Vous avez dépassé le nombre maximum de balises que vous pouvez appliquer à cette ressource.

Code d’état HTTP : 400

consultez aussi

Pour plus d'informations sur l'utilisation de cette API dans l'un des AWS SDK spécifiques au langage, consultez les pages suivantes :