Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
CreateDatasetImportJob
Crée une tâche qui importe les données d'entraînement de votre source de données (un compartiment Amazon S3) vers un ensemble de données Amazon Personalize. Pour autoriser Amazon Personalize à importer les données de formation, vous devez spécifier un rôle de service IAM autorisé à lire depuis la source de données, car Amazon Personalize crée une copie de vos données et les traite en interne. Pour plus d'informations sur l'octroi de l'accès à votre compartiment Amazon S3, consultez Giving Amazon Personalize Access to Amazon S3 Resources.
Si vous avez déjà créé un recommandateur ou déployé une version de solution personnalisée dans le cadre d'une campagne, l'influence des nouveaux enregistrements groupés sur les recommandations dépend du cas d'utilisation du domaine ou de la recette que vous utilisez. Pour plus d'informations, voir Comment les nouvelles données influencent les recommandations en temps réel.
Important
Par défaut, une tâche d'importation de jeu de données remplace toutes les données existantes du jeu de données que vous avez importé en bloc. Pour ajouter de nouveaux enregistrements sans remplacer les données existantes, spécifiez INCREMENTAL pour le mode d'importation de l' CreateDatasetImportJob opération.
Statut
Une tâche d'importation de jeux de données peut se trouver dans l'un des états suivants :
-
CREATE PENDING > CREATE IN_PROGRESS > ACTIVE -ou- CREATE FAILED
Pour connaître le statut de la tâche d'importation DescribeDatasetImportJob, appelez en fournissant le nom de ressource Amazon (ARN) de la tâche d'importation de l'ensemble de données. L'importation d'ensembles de données est terminée quand le statut ACTIVE (ACTIF) apparaît. Si le statut est CREATE FAILED, la réponse inclut une failureReason
clé qui décrit la raison de l'échec de la tâche.
Note
L'importation nécessite un certain temps. Vous devez attendre que le statut apparaisse comme ACTIF avant d'entraîner un modèle à l'aide du jeu de données.
API associées
Syntaxe de la requête
{
"datasetArn": "string
",
"dataSource": {
"dataLocation": "string
"
},
"importMode": "string
",
"jobName": "string
",
"publishAttributionMetricsToS3": boolean
,
"roleArn": "string
",
"tags": [
{
"tagKey": "string
",
"tagValue": "string
"
}
]
}
Paramètres de demande
Cette demande accepte les données suivantes au format JSON.
- datasetArn
-
L'ARN de l'ensemble de données qui reçoit les données importées.
Type : chaîne
Contraintes de longueur : longueur maximale de 256.
Modèle :
arn:([a-z\d-]+):personalize:.*:.*:.+
Obligatoire : oui
- dataSource
-
Le compartiment Amazon S3 qui contient les données d'entraînement à importer.
Type : objet DataSource
Obligatoire : oui
- importMode
-
Spécifiez comment ajouter les nouveaux enregistrements à un ensemble de données existant. Le mode d'importation par défaut est
FULL
. Si vous n'avez pas importé d'enregistrements groupés dans le jeu de données auparavant, vous pouvez uniquement le spécifierFULL
.-
Spécifiez
FULL
de remplacer toutes les données en bloc existantes dans votre ensemble de données. Les données que vous avez importées individuellement ne sont pas remplacées. -
Spécifiez
INCREMENTAL
d'ajouter les nouveaux enregistrements aux données existantes de votre ensemble de données. Amazon Personalize remplace tout enregistrement portant le même identifiant par le nouveau.
Type : chaîne
Valeurs valides :
FULL | INCREMENTAL
Obligatoire : non
-
- jobName
-
Nom de la tâche d'importation de l'ensemble de données.
Type : chaîne
Contraintes de longueur : longueur minimum de 1. Longueur maximum de 63.
Modèle :
^[a-zA-Z0-9][a-zA-Z0-9\-_]*
Obligatoire : oui
- publishAttributionMetricsToS3
-
Si vous avez créé une attribution de métriques, spécifiez si vous souhaitez publier des métriques pour cette tâche d'importation sur Amazon S3
Type : booléen
Obligatoire : non
- roleArn
-
L'ARN du rôle IAM autorisé à lire à partir de la source de données Amazon S3.
Type : chaîne
Contraintes de longueur : longueur maximale de 256.
Modèle :
arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+
Obligatoire : oui
-
Liste des balises à appliquer à la tâche d'importation de l'ensemble de données.
Type : tableau d’objets Tag
Membres du tableau : nombre minimum de 0 élément. Nombre maximum de 200 éléments.
Obligatoire : non
Syntaxe de la réponse
{
"datasetImportJobArn": "string"
}
Eléments de réponse
Si l’action aboutit, le service renvoie une réponse HTTP 200.
Les données suivantes sont renvoyées au format JSON par le service.
- datasetImportJobArn
-
L'ARN de la tâche d'importation du jeu de données.
Type : chaîne
Contraintes de longueur : longueur maximale de 256.
Modèle :
arn:([a-z\d-]+):personalize:.*:.*:.+
Erreurs
- InvalidInputException
-
Entrez une valeur valide pour le champ ou le paramètre.
Code d’état HTTP : 400
- LimitExceededException
-
La limite du nombre de demandes par seconde a été dépassée.
Code d’état HTTP : 400
- ResourceAlreadyExistsException
-
La ressource spécifiée existe déjà.
Code d’état HTTP : 400
- ResourceInUseException
-
La ressource spécifiée est en cours d'utilisation.
Code d’état HTTP : 400
- ResourceNotFoundException
-
Impossible de trouver la ressource spécifiée.
Code d’état HTTP : 400
- TooManyTagsException
-
Vous avez dépassé le nombre maximum de balises que vous pouvez appliquer à cette ressource.
Code d’état HTTP : 400
consultez aussi
Pour plus d'informations sur l'utilisation de cette API dans l'un des AWS SDK spécifiques au langage, consultez les pages suivantes :