Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation d'Amazon SageMaker Feature Store dans la console
Important
Les politiques IAM personnalisées qui permettent à Amazon SageMaker Studio ou Amazon SageMaker Studio Classic de créer des SageMaker ressources Amazon doivent également accorder des autorisations pour ajouter des balises à ces ressources. L'autorisation d'ajouter des balises aux ressources est requise car Studio et Studio Classic balisent automatiquement toutes les ressources qu'ils créent. Si une politique IAM autorise Studio et Studio Classic à créer des ressources mais n'autorise pas le balisage, des erreurs « AccessDenied » peuvent se produire lors de la tentative de création de ressources. Pour de plus amples informations, veuillez consulter Fournir des autorisations pour le balisage des ressources d' SageMaker IA.
AWS politiques gérées pour Amazon SageMaker AIqui donnent des autorisations pour créer des SageMaker ressources incluent déjà des autorisations pour ajouter des balises lors de la création de ces ressources.
Vous pouvez utiliser Amazon SageMaker Feature Store sur la console pour créer, consulter, mettre à jour et surveiller vos groupes de fonctionnalités. La surveillance décrite dans ce guide inclut la visualisation des exécutions du pipeline et de la généalogie de vos groupes de fonctionnalités. Ce guide fournit des instructions sur la manière d'effectuer ces tâches à partir de la console.
Pour des exemples de Feature Store et des ressources utilisant Amazon SageMaker APIs AWS SDK for Python (Boto3), consultezRessources Amazon SageMaker Feature Store.
Rubriques
Création d'un groupe de fonctionnalités depuis la console
Le processus de création d'un groupe de fonctionnalités comporte quatre étapes :
-
Entrez les informations du groupe de fonctionnalités.
-
Saisissez les définitions de fonctions.
-
Entrez les fonctionnalités requises.
-
Entrez les balises du groupe de fonctionnalités.
Déterminez laquelle des options suivantes correspond à votre cas d'utilisation :
-
Créez un magasin en ligne, un magasin hors connexion ou les deux. Pour plus d'informations sur les différences entre les boutiques en ligne et hors ligne, consultezConcepts liés à Feature Store.
-
Utilisez une AWS Key Management Service clé par défaut ou votre propre clé KMS. La clé par défaut est la cléAWS KMS (SSE-KMS). Vous pouvez réduire les coûts liés aux AWS KMS demandes en configurant l'utilisation des clés de compartiment Amazon S3 sur le compartiment Amazon S3 du magasin hors ligne. La clé de compartiment Amazon S3 doit être activée avant d'utiliser le compartiment pour vos groupes de fonctionnalités. Pour plus d'informations sur la réduction des coûts en utilisant les clés de compartiment Amazon S3, consultez Réduire le coût du SSE-KMS avec les clés de compartiment Amazon S3.
Vous pouvez utiliser la même clé pour les magasins en ligne et hors connexion, ou utiliser une clé unique pour chaque magasin. Pour plus d'informations sur AWS KMS, voir AWS Key Management Service.
-
Si vous créez un magasin hors connexion :
-
Décidez si vous souhaitez créer un compartiment Amazon S3 ou en utiliser un existant. Lorsque vous en utilisez un existant, vous devez connaître l'URL du compartiment Amazon S3 ou le nom du compartiment Amazon S3 et le nom du répertoire du jeu de données, le cas échéant.
-
Choisissez le nom de ressource Amazon (ARN) à utiliser pour spécifier le rôle IAM. Pour plus d'informations sur la façon de trouver votre rôle et les politiques associées, consultezAjout de politiques à votre rôle IAM.
-
Décidez si vous souhaitez utiliser le AWS Glue (par défaut) ou Apache Iceberg format de tableau. Dans la plupart des cas d'utilisation, vous utilisez le Apache Iceberg format de tableau. Pour plus d'informations sur les formats de tableau, consultezUtilisation de Feature Store avec le kit SDK pour Python (Boto3).
-
Vous pouvez utiliser la console pour afficher le lignage d'un groupe de fonctionnalités. Les instructions d'utilisation du Feature Store sur la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.
-
Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.
-
Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.
-
Dans la liste déroulante, choisissez Feature Store.
-
Choisissez Create Feature Group (Créer un groupe de fonctions).
-
Sous Détails des groupes de fonctionnalités, entrez un nom de groupe de fonctionnalités.
-
(Facultatif) Entrez une description du groupe de fonctionnalités.
-
Sous Configuration du stockage des groupes de fonctionnalités, choisissez une configuration de stockage dans la liste déroulante. Pour plus d'informations sur les configurations de stockage, consultezConfigurations de stockage Feature Store.
-
Si vous avez choisi d'activer le stockage en ligne :
-
Si vous activez uniquement le stockage en ligne, vous pouvez choisir un type de stockage dans la liste déroulante. Pour plus d'informations sur les types de stockage des boutiques en ligne, consultezLe magasin en ligne.
-
(Facultatif) Appliquez Time to Live (TTL) en activant le commutateur et en spécifiant la valeur et l'unité de durée Time to Live. Cela mettra à jour la durée TTL par défaut pour tous les enregistrements ajoutés au groupe de fonctionnalités après la création de ce dernier. Pour plus d'informations sur le TTL, consultezDurée de vie (TTL) pour les enregistrements.
-
-
Si vous avez choisi d'activer le stockage hors ligne :
-
Sous le nom du compartiment Amazon S3, entrez un nouveau nom de compartiment ou saisissez manuellement l'URL d'un compartiment existant.
-
Dans la liste déroulante Format de table, choisissez le format de table. Dans la plupart des cas d'utilisation, vous devez utiliser le Apache Iceberg format de tableau. Pour plus d'informations sur les formats de tableau, consultezUtilisation de Feature Store avec le kit SDK pour Python (Boto3).
-
Sous ARN du rôle IAM, choisissez l'ARN du rôle IAM que vous souhaitez attacher à ce groupe de fonctionnalités. Pour plus d'informations sur la façon de trouver votre rôle et les politiques associées, consultezAjout de politiques à votre rôle IAM.
-
Si vous avez choisi d'activer le format de tableau pour le stockage hors ligne et le format de tableau AWS Glue (par défaut), sous Catalogue de données, vous pouvez choisir l'une des deux options suivantes :
-
Utilisez les valeurs par défaut pour votre AWS Glue Data Catalog.
-
Indiquez le nom de votre catalogue de données, le nom de la table et le nom de la base de données existants pour étendre votre catalogue existant AWS Glue Data Catalog.
-
-
-
Dans la liste déroulante Clé de chiffrement de la boutique en ligne ou Clé de chiffrement de la boutique hors ligne, choisissez l'une des options suivantes :
-
Utilisation AWS gérée AWS KMS key (par défaut)
-
Entrez un AWS KMS key ARN et entrez votre AWS KMS clé ARN sous ARN de la clé de chiffrement du magasin hors ligne. Pour plus d'informations AWS KMS, consultez la section Service de gestion des AWS clés.
-
-
Le cas échéant, vous aurez la possibilité de choisir votre mode de débit, ce qui aura une incidence sur le mode de facturation. Sous Mode débit, choisissez un mode dans la liste déroulante et entrez les capacités de lecture et d'écriture lorsqu'elles sont disponibles. Pour plus d'informations sur les modes de débit, par exemple le moment où le mode peut être appliqué et les unités de capacité, consultezModes de débit.
-
Une fois que vous avez spécifié toutes les informations requises, le bouton Continuer apparaît disponible. Choisissez Continuer.
-
Sous Spécifier les définitions de fonctionnalités, deux options s'offrent à vous pour fournir un schéma de vos fonctionnalités : un éditeur JSON ou un éditeur de table.
-
Éditeur JSON : dans l'onglet JSON, entrez ou copiez-collez vos définitions de fonctionnalités au format JSON.
-
Éditeur de tableau : dans l'onglet Tableau, entrez le nom de la fonction et choisissez le type de données correspondant pour chaque entité de votre groupe d'entités. Choisissez + Ajouter des définitions de fonctionnalités pour inclure d'autres fonctionnalités. Sachez que vous ne pouvez pas supprimer les définitions de fonctions de vos groupes de fonctionnalités. Toutefois, vous pouvez ajouter et mettre à jour des définitions de fonctions une fois le groupe de fonctionnalités créé.
Un groupe d'entités doit comporter au moins deux entités qui représentent l'identifiant de l'enregistrement et l'heure de l'événement :
-
Le type de fonction d'enregistrement peut être une chaîne, une fraction ou une intégrale.
-
Heure de l'événement Le type de fonction doit être une chaîne ou une fraction. Toutefois, si vous avez choisi le Iceberg format de tableau, l'heure de l'événement doit être une chaîne.
-
-
Une fois que toutes les fonctionnalités sont incluses, choisissez Continuer.
-
Sous Sélectionner les fonctionnalités requises, vous devez spécifier l'identifiant de l'enregistrement et les fonctionnalités relatives à l'heure de l'événement. Pour ce faire, choisissez le nom de la fonctionnalité dans les listes déroulantes Nom de la fonctionnalité Identifiant de l'enregistrement et Nom de la fonctionnalité Event time, respectivement.
-
Après avoir choisi l'identifiant d'enregistrement et les fonctionnalités relatives à l'heure de l'événement, choisissez Continuer.
-
(Facultatif) Pour ajouter des balises au groupe de fonctionnalités, choisissez Ajouter une nouvelle balise. Entrez ensuite une clé de balise et la valeur correspondante sous Clé et Valeur, respectivement.
-
Choisissez Continuer.
-
Sous Vérifier le groupe de fonctionnalités, passez en revue les informations du groupe de fonctionnalités. Pour modifier une étape, cliquez sur le bouton Modifier correspondant à cette étape. Cela vous amène à l'étape de modification correspondante. Pour revenir à l'étape 5, choisissez Continuer jusqu'à ce que vous reveniez à l'étape 5.
-
Après avoir finalisé la configuration de votre groupe de fonctionnalités, choisissez Create feature group.
Si un problème survient lors de l'installation, un message d'alerte contextuel apparaît au bas de la page avec des conseils pour le résoudre. Vous pouvez revenir aux étapes précédentes pour résoudre les problèmes en choisissant Modifier pour l'étape présentant des conflits.
Une fois le groupe de fonctionnalités créé avec succès, un message contextuel vert apparaît au bas de la page. Le nouveau groupe de fonctionnalités apparaît également dans votre catalogue de groupes d'entités.
Afficher les détails des groupes de fonctionnalités depuis la console
Vous pouvez consulter les détails de vos groupes de fonctionnalités une fois qu'un groupe de fonctionnalités a été créé avec succès dans le Feature Store.
Vous pouvez utiliser la console ou l'API Amazon SageMaker Feature Store pour consulter les détails de votre groupe de fonctionnalités. Les instructions relatives à l'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.
-
Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.
-
Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.
-
Dans la liste déroulante, choisissez Feature Store.
-
(Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.
-
Sous l'onglet Catalogue de groupes de fonctionnalités, choisissez le nom de votre groupe de fonctionnalités dans la liste. La page du groupe de fonctionnalités s'ouvre.
-
Dans l'onglet Fonctionnalités, vous trouverez la liste de toutes les fonctionnalités. Utilisez le filtre pour affiner votre liste. Choisissez une fonction pour en afficher les détails.
-
Sous l'onglet Détails et le sous-onglet Informations, vous pouvez consulter les informations relatives à vos groupes d'entités. Cela inclut la dernière exécution, les paramètres de stockage hors ligne, les paramètres de stockage en ligne, etc.
-
Dans l'onglet Détails et le sous-onglet Balises, vous pouvez consulter les balises de vos groupes d'entités. Choisissez Ajouter une nouvelle balise pour ajouter une nouvelle balise ou Supprimer pour supprimer une balise.
-
Dans l'onglet Exécutions de pipelines, vous pouvez afficher les pipelines ou les exécutions de pipeline associés à votre groupe de fonctionnalités.
-
Dans l'onglet Lineage, vous pouvez afficher le lignage de votre groupe de fonctionnalités.
Mettre à jour un groupe de fonctionnalités depuis la console
Vous pouvez mettre à jour vos groupes de fonctionnalités une fois qu'un groupe de fonctionnalités a été créé avec succès dans le Feature Store.
Vous pouvez utiliser la console ou l'API Amazon SageMaker Feature Store pour mettre à jour un groupe de fonctionnalités. Les instructions relatives à l'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.
-
Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.
-
Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.
-
Dans la liste déroulante, choisissez Feature Store.
-
(Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.
-
Sous l'onglet Catalogue de groupes de fonctionnalités, recherchez et choisissez le nom de votre groupe de fonctionnalités dans la liste. La page du groupe de fonctionnalités s'ouvre.
-
Choisissez Mettre à jour le groupe de fonctionnalités.
-
(Facultatif) Le cas échéant, vous pouvez modifier votre mode de débit, ce qui a un impact sur le mode de facturation. Sous Mode débit, choisissez un mode dans la liste déroulante et entrez les capacités de lecture et d'écriture lorsqu'elles sont disponibles. Pour plus d'informations sur les modes de débit, par exemple le moment où le mode peut être appliqué et les unités de capacité, consultezModes de débit.
-
(Facultatif) Si votre groupe de fonctionnalités utilise le magasin en ligne, vous pouvez mettre à jour le paramètre Durée de vie (TTL) par défaut. Si la durée de vie (TTL) n'a pas été activée pour le groupe de fonctionnalités, basculez l'interrupteur situé sous Durée de vie (TTL) sur Activé. Vous pouvez spécifier la valeur et l'unité TTL sous Durée de vie. Cela mettra à jour la durée TTL par défaut pour tous les enregistrements ajoutés au groupe de fonctionnalités après la mise à jour du groupe de fonctionnalités.
-
(Facultatif) Vous pouvez ajouter des définitions de fonctionnalités à votre groupe de fonctionnalités, mais sachez que vous ne pouvez pas supprimer les définitions de fonctionnalités de vos groupes de fonctionnalités. Pour ajouter une définition de fonction, choisissez + Ajouter une définition de fonction, puis spécifiez le nouveau nom de définition de fonction dans la colonne Nom et sélectionnez le type de fonction dans la colonne Type de fonction.
-
Sélectionnez Enregistrer les modifications.
-
Pour confirmer vos modifications, choisissez Confirmer.
Afficher les exécutions du pipeline depuis la console
Vous pouvez consulter les dernières informations d'exécution du pipeline pour une fonction ou un groupe de fonctionnalités sous Exécutions du pipeline. Vous pouvez également obtenir des liens vers des pipelines, des exécutions, du code et d'autres informations utiles sur l'exécution.
Vous pouvez utiliser la console pour visualiser les exécutions de vos pipelines. Les instructions relatives à l'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.
-
Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.
-
Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.
-
Dans la liste déroulante, choisissez Feature Store.
-
(Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.
-
Choisissez un groupe de fonctionnalités ou une fonctionnalité pour visualiser leurs exécutions de pipeline.
-
Choisissez l'onglet Exécutions des pipelines.
-
Recherchez un pipeline dans la liste déroulante Sélectionner un pipeline.
-
Vous pouvez consulter les liens relatifs au pipeline, à l'exécution et aux détails du code. Vous pouvez également consulter le propriétaire, le statut, la date et la durée de l'exécution.
Afficher le lignage depuis la console
Vous pouvez afficher la lignée d'un groupe de fonctionnalités. La lignée inclut les informations relatives au code d'exécution de votre flux de travail de fonctionnalisation, aux sources de données utilisées et à la manière dont elles sont ingérées au groupe de fonctionnalités ou à la fonctionnalité.
Vous pouvez utiliser la console pour afficher le lignage d'un groupe de fonctionnalités. Les instructions d'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.
-
Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.
-
Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.
-
Dans la liste déroulante, choisissez Feature Store.
-
(Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.
-
Choisissez un groupe d'entités ou une entité pour afficher les détails de sa lignée.
-
Choisissez l'onglet Lignée.
-
Choisissez un groupe de fonctionnalités ou un nœud de pipeline pour étendre le nœud. Il contient des informations supplémentaires sur un groupe de fonctionnalités ou un pipeline.
-
Vous pouvez zoomer, dézoomer ou recentrer le graphe de lignée à l'aide des boutons situés en bas à gauche de l'écran.
-
Vous pouvez vous déplacer sur la carte de lignage quand vous le souhaitez et faire glisser l'écran. Pour déplacer vos cartes de lignage en utilisant les nœuds comme point focal, vous pouvez appuyer sur Tab ou Shift+Tab pour passer d'un nœud à l'autre.
-
Le cas échéant, vous pouvez parcourir le lignage en amont (à gauche, plus tôt) ou en aval (à droite, le plus récent). Pour ce faire, choisissez un nœud, puis choisissez Query upstream lineage ou Query downstream lineage.