Remplacement du schéma d'un ensemble de données pour ajouter de nouvelles colonnes - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Remplacement du schéma d'un ensemble de données pour ajouter de nouvelles colonnes

Après avoir créé un jeu de données Items ou Users, vous pouvez remplacer son schéma par un nouveau ou un schéma existant. Vous pouvez remplacer la structure d'un ensemble de données si votre structure de données a changé après avoir créé le jeu de données. Par exemple, vous pouvez avoir une nouvelle colonne de métadonnées d'articles que vous souhaitez qu'Amazon Personalize prenne en compte pendant la formation. Vous pouvez également ajouter une colonne de données à utiliser uniquement pour filtrer les recommandations.

Lorsque vous remplacez le schéma d'un jeu de données, vous devez conserver tous les champs du schéma précédent et vous ne pouvez pas modifier leurs types de données ou leurs attributs. Une fois que vous avez remplacé le schéma d'un ensemble de données, Amazon Personalize exclut automatiquement toute nouvelle colonne de la formation des recommandateurs ou des solutions personnalisées existants. Pour plus de directives et d'exigences, voirDirectives et exigences.

Vous pouvez remplacer le schéma d'un ensemble de données par la console Amazon Personalize AWS Command Line Interface (AWS CLI) et AWS les SDK.

Directives et exigences

Avant de remplacer le schéma d'un ensemble de données, assurez-vous de connaître les directives et exigences suivantes :

  • Vous ne pouvez pas remplacer le schéma d'un jeu de données d'interactions Item, d'un jeu de données d'interactions Action ou d'un jeu de données Actions.

  • Vous pouvez ajouter de nouveaux champs à votre schéma de remplacement, mais vous devez conserver tous les champs du schéma précédent. Et vous ne pouvez pas modifier leurs types de données ou leurs attributs. Par exemple, si le schéma précédent inclut un MEMBERSHIP_STATUS champ pour les données de chaîne catégorielles, le nouveau schéma que vous utilisez doit inclure un MEMBERSHIP_STATUS champ avec ces attributs et types de données.

  • Si le schéma actuel comporte un champ que vous souhaitez renommer, ou si vous souhaitez modifier ses types de données ou ses attributs, vous pouvez ajouter un nouveau champ avec un nouveau nom et des types ou attributs modifiés. Incluez ensuite le nouveau champ dans la formation et excluez l'ancien champ. Tout nouveau champ doit contenir des null données. Si l'ancien champ ne prenait pas en charge les données nulles, lorsque vous importez des données, vous pouvez utiliser des données de substitution pour vous assurer que votre importation correspond au schéma. Pour plus d'informations sur la configuration des colonnes utilisées par un recommandeur, consultezMettre à jour un recommandeur. Pour plus d'informations sur la configuration des colonnes utilisées par une solution, consultezConfiguration des colonnes utilisées lors de l'entraînement.

  • Tout nouveau champ doit contenir des null données. Pour plus d'informations sur l'ajout d'un type nul à un champ, consultezTypes de données de schéma.

  • Une fois que vous avez remplacé le schéma d'un ensemble de données, Amazon Personalize exclut automatiquement toute nouvelle colonne de la formation des recommandateurs ou des solutions personnalisées existants. L'utilisation du jeu de données modifié implique les actions suivantes :

    • Pour utiliser de nouvelles colonnes lors de l'entraînement, importez des données conformes au nouveau schéma. Mettez ensuite à jour tous les recommandateurs pour qu'ils utilisent de nouvelles colonnes, ou créez une nouvelle solution personnalisée et configurez les colonnes qu'elle utilise lors de l'entraînement.

      Pour plus d'informations sur la mise à jour des colonnes utilisées par un recommandeur, consultezMettre à jour un recommandeur. Pour plus d'informations sur la configuration des colonnes utilisées par une solution, consultezConfiguration des colonnes utilisées lors de l'entraînement.

    • Pour utiliser des colonnes uniquement lors du filtrage, importez des données conformes au nouveau schéma, créez un filtre qui utilise les nouvelles données et appliquez votre filtre à vos demandes de recommandation. Vous n'avez pas besoin de mettre à jour les recommandations, ni de créer ou de mettre à jour de ressources personnalisées.

Remplacement du schéma d'un ensemble de données (console)

Pour remplacer le schéma d'un ensemble de données par la console Amazon Personalize, vous choisissez le jeu de données à modifier et choisissez de le remplacer par un nouveau schéma ou d'utiliser un schéma existant.

Pour remplacer le schéma d'un ensemble de données
  1. Ouvrez la console Amazon Personalize à l'adresse https://console.aws.amazon.com/personalize/home et connectez-vous à votre compte.

  2. Sur la page Groupes de jeux de données, choisissez votre groupe de jeux de données.

  3. Dans le volet de navigation, choisissez Datasets, puis cliquez sur le bouton radio correspondant au jeu de données que vous souhaitez modifier.

  4. Choisissez Actions, puis sélectionnez Remplacer le schéma.

  5. Dans Détails du schéma, choisissez de le remplacer par un nouveau schéma ou un schéma créé précédemment.

  6. Spécifiez le nouveau schéma à utiliser. Si vous avez choisi de :

    • Remplacez-le par un nouveau schéma, nommez-le et, dans Définition du schéma, apportez vos modifications au schéma JSON.

    • Utilisez un schéma créé précédemment, puis dans Schéma créé précédemment, choisissez le schéma que vous souhaitez utiliser. Seuls les schémas éligibles sont répertoriés. Pour plus d'informations sur les exigences du schéma, consultezDirectives et exigences.

  7. Choisissez Remplacer. Lorsque le jeu de données est actif, vous pouvez commencer à importer des données conformes au nouveau schéma. Pour plus d’informations, consultez Étape 2 : Préparation et importation des données.

Remplacement du schéma d'un ensemble de données (AWS CLI)

Pour remplacer le schéma d'un ensemble de données par le AWS CLI, utilisez la update-dataset commande, spécifiez le nom de ressource Amazon (ARN) de l'ensemble de données à mettre à jour et l'ARN du nouveau schéma à utiliser. Vous ne pouvez pas mettre à jour le schéma d'un jeu de données d'interactions Item, d'un jeu de données d'interactions Action ou d'un jeu de données Actions.

Le code suivant montre comment mettre à jour le schéma d'un ensemble de données avec le AWS CLI. Pour remplacer le schéma d'un ensemble de données par un nouveau, utilisez d'abord la create-schema commande. Utilisez ensuite le code suivant pour remplacer le schéma actuel par le nouveau. Pour plus d'informations sur la création d'un schéma avec le AWS CLI, consultezCréation d'un jeu de données et d'un schéma (AWS CLI). Pour plus d'informations sur les ensembles de données et les exigences en matière de schéma, consultezSchémas.

aws personalize update-dataset \ --dataset-arn Dataset ARN \ --schema-arn New schema ARN

Lorsque le jeu de données est actif, vous pouvez commencer à importer des données conformes au nouveau schéma. Pour plus d’informations, consultez Étape 2 : Préparation et importation des données. Pour plus d'informations sur la dernière mise à jour du jeu de données, vous pouvez utiliser l'DescribeDatasetopération.

Remplacement du schéma d'un ensemble de données (AWS SDK)

Pour remplacer le schéma d'un ensemble de données par les AWS SDK, vous devez utiliser l'opération UpdateDataset API. Spécifiez le nom de ressource Amazon (ARN) de l'ensemble de données à mettre à jour et le nouveau schéma à utiliser. Vous ne pouvez pas mettre à jour le schéma d'un jeu de données d'interactions Item, d'un jeu de données d'interactions Action ou d'un jeu de données Actions.

Le code suivant montre comment remplacer le schéma d'un ensemble de données par le SDK pour Python (Boto3). Pour remplacer le schéma d'un ensemble de données par un nouveau, utilisez d'abord l'CreateSchemaopération. Utilisez ensuite le code suivant pour remplacer le schéma actuel par le nouveau. Pour plus d'informations sur la création d'un schéma avec AWS les SDK, consultezCréation d'un jeu de données et d'un schéma (AWS SDK). Pour plus d'informations sur les exigences relatives aux ensembles de données et aux schémas, consultezSchémas.

import boto3 personalize = boto3.client('personalize') update_dataset_response = personalize.update_dataset( datasetArn = 'dataset_arn', schemaArn = 'new_schema_arn' ) print(update_dataset_response)

Lorsque le jeu de données est actif, vous pouvez commencer à importer des données conformes au nouveau schéma. Pour plus d’informations, consultez Étape 2 : Préparation et importation des données. Pour plus d'informations sur la dernière mise à jour du jeu de données, vous pouvez utiliser l'DescribeDatasetopération.