Mise à jour d'un jeu de données - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mise à jour d'un jeu de données

Après avoir importé votre ensemble de données initial dans Amazon SageMaker Canvas, il se peut que vous souhaitiez ajouter des données supplémentaires à votre ensemble de données. Par exemple, vous pouvez obtenir des données d'inventaire à la fin de chaque semaine que vous souhaitez ajouter à votre jeu de données. Au lieu d'importer vos données plusieurs fois, vous pouvez mettre à jour votre jeu de données existant et y ajouter des fichiers ou en supprimer.

Note

Vous ne pouvez mettre à jour que les jeux de données que vous avez importés via le chargement local ou Amazon S3.

Vous pouvez mettre à jour votre jeu de données manuellement ou automatiquement. Pour plus d'informations sur les mises à jour automatiques des jeux de données, consultezConfiguration des mises à jour automatiques pour un jeu de données.

Chaque fois que vous mettez à jour votre jeu de données, Canvas crée une nouvelle version de votre jeu de données. Vous ne pouvez utiliser que la dernière version de votre jeu de données pour créer un modèle ou générer des prédictions. Pour plus d'informations sur l'affichage de l'historique des versions de votre jeu de données, consultez Affichage des détails de votre jeu de données.

Vous pouvez également utiliser les mises à jour des jeux de données avec des prédictions par lots automatisées, qui démarrent une tâche de prédiction par lots chaque fois que vous mettez à jour votre jeu de données. Pour de plus amples informations, veuillez consulter Prédictions par lots dans SageMaker Canvas.

La section suivante décrit comment effectuer des mises à jour manuelles de votre ensemble de données.

Mise à jour manuelle d'un jeu de données

Pour effectuer une mise à jour manuelle, procédez comme suit :

  1. Ouvrez l'application SageMaker Canvas.

  2. Dans le panneau de navigation de gauche, sélectionnez Datasets (Jeux de données).

  3. Dans la liste des jeux de données, choisissez le jeu de données que vous souhaitez mettre à jour.

  4. Choisissez le menu déroulant Mettre à jour le jeu de données, puis choisissez Mise à jour manuelle. Vous accédez au flux de travail d'importation de données.

  5. Dans le menu déroulant Source de données, choisissez Chargement local ou Amazon S3.

  6. La page affiche un aperçu de vos données. À partir de cette page, vous pouvez ajouter des fichiers au jeu de données ou en supprimer. Si vous importez des données tabulaires, le schéma des nouveaux fichiers (noms de colonnes et types de données) doit correspondre au schéma des fichiers existants. En outre, vos nouveaux fichiers ne doivent pas dépasser la taille de jeu de données ou de fichier maximale. Pour plus d'informations sur ces limitations, consultez Importation d'un jeu de données.

    Note

    Si vous ajoutez un fichier portant le même nom qu'un fichier existant dans votre jeu de données, le nouveau fichier remplace l'ancienne version du fichier.

  7. Lorsque vous êtes prêt à enregistrer des modifications, choisissez Mettre à jour le jeu de données.

Vous devriez maintenant disposer d'une nouvelle version de votre jeu de données.

Sur la page Jeux de données, vous pouvez choisir l'onglet Historique des versions pour voir toutes les versions de votre jeu de données, ainsi que l'historique des mises à jour manuelles et automatiques que vous avez effectuées.