Utilisez Amazon SageMaker Feature Store avec Amazon SageMaker Studio - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisez Amazon SageMaker Feature Store avec Amazon SageMaker Studio

Vous pouvez utiliser Amazon SageMaker Studio pour créer et afficher les informations d'accès à vos groupes de fonctionnalités.

Créer un groupe de fonctionnalités dans Studio

Le processus de création d'un groupe d'entités comporte quatre étapes :

  1. Entrez les informations relatives aux groupes de fonctionnalités.

  2. Saisissez les définitions de fonctions.

  3. Entrez les fonctionnalités requises.

  4. Entrez les balises des groupes de fonctionnalités.

Déterminez l'option à utiliser à partir de l'une des options suivantes :

  • Créez une boutique en ligne, une boutique hors ligne ou les deux. Pour plus d'informations sur les différences entre les boutiques en ligne et hors ligne, voirConcepts du Feature Store.

  • Afficher une valeurAWS Key Management Serviceclé ou votre propre clé KMS La clé par défaut estAWS KMSclé (SSE-KMS). Vous pouvez réduireAWS KMSdemander les coûts en configurant l'utilisation des clés de compartiment Amazon S3 sur le compartiment de la boutique hors ligne Amazon S3. La clé de compartiment Amazon S3 doit être activée avant d'utiliser le compartiment pour vos groupes de fonctionnalités. Pour plus d'informations sur la réduction des coûts en utilisant les clés de compartiment Amazon S3, voirRéduction du coût du SSE-KMS avec les clés de compartiment Amazon S3.

    Vous pouvez utiliser la même clé pour les boutiques en ligne et hors ligne, ou avoir une clé unique pour chacune. Pour plus d'informations sur AWS KMS, consultez AWS Key Management Service.

  • Si vous créez une boutique hors ligne :

    • Vous pouvez choisir de créer un compartiment Amazon S3 ou les remplacer. Lorsque vous en utilisez un existant, vous devez connaître l'URL du compartiment Amazon S3 ou le nom du compartiment Amazon S3 et le nom du répertoire du jeu de données, le cas échéant.

    • Choisissez l'ARN du rôle IAM à utiliser. Pour de plus amples informations sur la manière de trouver votre rôle et les politiques associées, voirAjouter des politiques à votre rôle IAM.

    • Décidez si vous souhaitez utiliser leAWS Glue(par défaut) ou format de table Apache Iceberg. Dans la plupart des cas d'utilisation, vous utilisez le format de table Apache Iceberg. Pour plus d'informations sur les formats de tableaux, voirCréation de groupes de fonctionnalités.

Étapes pour créer un groupe de fonctionnalités à l'aide de Studio
  1. Ouvrez le groupe de fonctionnalités Pour plus d'informations, veuillez consulter Lancez Amazon SageMaker Studio.

  2. Choisissez leAccueilicône ( ) sur le panneau de gauche.

  3. Choisissez Données.

  4. Dans la liste déroulante, choisissezBoutique de fonctionnalités.

  5. Choisissez Create Feature Group (Créer un groupe de fonctions).

  6. SousInformations sur les groupes de fonctionnalités, entrez un nom de groupe de fonctionnalités.

  7. (Facultatif) Entrez une description du groupe de fonctionnalités par Sage.

  8. SousConfiguration du stockage des groupes de fonctionnalités, choisissez un type de stockage parmiType de rangementliste déroulante.

    Si vous choisissez le stockage hors ligne :

    1. À partir duNom du compartiment Amazon S3liste déroulante, choisissez un nom de compartiment Amazon S3 existant, entrez un nouveau nom de compartiment ou choisissezEntrez l'URL du bucket manuellementet entrez l'URL sousAdresse du compartiment Amazon S3.

    2. (Facultatif) Si vous avez un nom de répertoire spécifique pour votre ensemble de données, choisissez l'un desNom du répertoire du jeu de donnéesliste déroulante.

    3. À partir duFormat de tableauliste déroulante, choisissez le format du tableau. Dans la plupart des cas d'utilisation, vous devez utiliser le format de table Apache Iceberg. Pour plus d'informations sur les formats de tableaux, voirCréation de groupes de fonctionnalités.

    4. SousARN du rôle, choisissez l'ARN du rôle IAM que vous souhaitez associer à ce groupe de fonctionnalités. Pour de plus amples informations sur la manière de trouver votre rôle et les politiques associées, voirAjouter des politiques à votre rôle IAM.

  9. En vertu duClé de chiffrement de la boutique en ligneouClé de chiffrement du magasin hors ligneliste déroulante, choisissezUtiliserAWSgéréAWS KMSclé (par défaut)ouEntrez unAWS KMSARN cléet entrez votreAWS KMSARN clé sousARN de la clé de chiffrement du magasin hors ligne. Pour plus d'informations surAWS KMS, voirAWSService de gestion des clés.

  10. (Facultatif) Si vous avez choisi le stockage en ligneType de rangement, vous allez créerTime to Live (TTL)en basculant le commutateur surSuret en spécifiantDurée du temps de vie, consultezvaleur et unité Cela mettra à jour la durée TTL par défaut pour tous les enregistrements ajoutés au groupe de fonctionnalités.après la création du groupe de fonctionnalités.

  11. Si vous avez choisi le stockage hors ligneFormat de tableauetAWS Glue(par défaut)Format de tableau, sousCatalogue de données, vous utiliserez la.Utilisez les valeurs par défaut pour votreAWS Gluecatalogue de donnéesou indiquez le nom de votre catalogue de données, le nom de la table et le nom de la base de données existants pour étendre votreAWS Gluecatalogue

  12. Une fois que toutes les informations requises ont été spécifiées,Poursuivrele bouton est disponible. Choisissez Continue (Continuer).

  13. SousDéfinir les définitions des fonctionnalités, deux options s'offrent à vous pour fournir un schéma de vos fonctions : un éditeur JSON ou un éditeur Table. Dans l'onglet JSON, saisissez ou copiez-collez vos définitions de fonctionnalités au format JSON. Pour l'éditeur de table, saisissez le nom et choisissez le type de données correspondant pour chaque entité de votre groupe d'entités. Choisissez+ Ajouter des définitions de fonctionnalitéspour inclure davantage de fonctionnalités. Sachez que vous ne pouvez pas supprimer les définitions de fonctions de vos groupes d'entités, mais que vous pouvez ajouter et mettre à jour des définitions de fonctions une fois le groupe d'entités créé.

    Un groupe d'entités doit comporter au moins deux entités représentant l'identifiant de l'enregistrement et l'heure de l'événement :

    • Le recordTypepeut être une chaîne, une fraction ou une intégrale.

    • Heure de début de l'événementTypedoit être une chaîne ou un fractionnaire. Toutefois, si vous avez choisi le format de tableau Iceberg, l'heure de l'événement doit être une chaîne.

  14. Une fois que toutes les fonctionnalités sont incluses, choisissezPoursuivre.

  15. SousSélectionner Selecators forvous devez spécifier l'identifiant d'enregistrement et les fonctionnalités relatives à l'heure de l'événement en choisissant le nom de la fonctionnalité sousNom de la fonction d'identification de l'enregistrementetNom de la fonctionnalité Event Timelistes déroulantes, respectivement.

  16. Une fois les fonctionnalités d'identifiant d'enregistrement et de durée de l'événement choisies, choisissezPoursuivre.

  17. (Facultatif) Ajoutez des balises pour le groupe de fonctionnalités en sélectionnant d'abordAjouter un nouveau tagpuis en saisissant une clé de balise et la valeur correspondante sousCléetValeur, respectivement.

  18. Choisissez Continue (Continuer).

  19. SousIntégration à l'aide de la console, passez en revue les informations relatives aux groupes de fonctionnalités. Vous pouvez modifier n'importe quelle étape en choisissantModifierbouton correspondant à cette étape. Cela vous amène à l'étape de modification correspondante. Pour revenir à l'étape 5, sélectionnezPoursuivrejusqu'à ce que vous reveniez à l'étape 5.

  20. Une fois que vous avez finalisé la configuration de votre groupe de fonctionnalités, choisissezCréation d'un groupe de fonctionnalités.

    En cas de problème avec la configuration, un message d'alerte rouge apparaît au bas de la page avec des conseils pour résoudre le problème. Vous pouvez revenir aux étapes précédentes pour les corriger.

    Si le groupe de fonctionnalités a été créé avec succès, un message contextuel vert apparaît au bas de la page. Lorsque le groupe d'entités est avec succès, il apparaît dans le catalogue des groupes d'entités.

Afficher les détails des groupes de fonctionnalités dans Studio

Vous pouvez consulter les détails de vos groupes de fonctionnalités une fois qu'un groupe de fonctionnalités a été créé avec succès dans le Feature Store.

  1. Ouvrez le groupe de fonctionnalités Pour plus d'informations, veuillez consulter Lancez Amazon SageMaker Studio.

  2. Choisissez leAccueilicône ( ) sur le panneau de gauche.

  3. Choisissez Données.

  4. Dans la liste déroulante, choisissezBoutique de fonctionnalités.

  5. En vertu duCatalogue des groupes de fonctionnalitésonglet, choisissez le nom de votre groupe de fonctionnalités dans la liste. Cela ouvre la page de groupe de fonctionnalités.

  6. En vertu duDétailsonglet etInformationssous-onglet, vous pouvez consulter les informations de votre groupe de fonctionnalités, y compris, mais sans s'y limiter,Dernière exécution,Paramètres de stockage hors ligne, etParamètres de l'espace de l'opérateur.

  7. En vertu duDétailsonglet etBalisessous-onglet, vous pouvez consulter les balises de vos groupes de fonctionnalités. ChoisissezAjouter un nouveau tagpour ajouter un nouveau tagSupprimerpour supprimer une étiquette.

  8. Sur leFonctionnalitésdans l'onglet, vous trouvez une liste de toutes les fonctionnalités. Utilisez le filtre pour affiner votre liste. Choisissez une fonction pour en afficher les détails.

Mettre à jour le groupe de fonctionnalités dans Studio

Vous pouvez mettre à jour vos groupes de fonctionnalités une fois qu'un groupe de fonctionnalités a été créé avec succès dans le Feature Store.

  1. Ouvrez le groupe de fonctionnalités Pour plus d'informations, veuillez consulter Lancez Amazon SageMaker Studio.

  2. Choisissez leAccueilicône ( ) sur le panneau de gauche.

  3. Choisissez Données.

  4. Dans la liste déroulante, choisissezBoutique de fonctionnalités.

  5. En vertu duCatalogue des groupes de fonctionnalitésonglet, recherchez et choisissez le nom de votre groupe de fonctionnalités dans la liste. Cela ouvre la page de groupe de fonctionnalités.

  6. ChoisissezMettre à jour le groupe de fonctionnalités.

  7. (Facultatif) Si votre groupe de fonctionnalités utilise la boutique en ligne, vous pouvez mettre à jour la valeur par défautTime to Live (TTL). Si le TTL n'a pas été activé pour le groupe de fonctionnalités, actionnez le bouton de commutation sousTime to Live (TTL)pourSur. Vous pouvez spécifier la valeur et l'unité TTL dansDurée du temps de vie, consultez. Cela mettra à jour la durée TTL par défaut pour tous les enregistrements ajoutés au groupe de fonctionnalités.après la mise à jour du groupe de fonctionnalités.

  8. (Facultatif) Vous pouvez ajouter des définitions de fonctionnalités à votre groupe de fonctionnalités, mais sachez que vous ne pouvez pas supprimer de définitions de fonctionnalités de vos groupes de fonctionnalités. Pour ajouter une définition de fonction, choisissez+ Ajouter une définition de fonctionnalitépuis spécifiez le nom de la nouvelle définition de fonctionnalité sous leNomet sélectionnez le type de fonction sous leTypecolonne.

  9. Choisissez Save Changes (Enregistrer les modifications).

  10. Pour confirmer vos modifications, choisissezConfirmer.

Afficher les exécutions du pipeline dans Studio

Vous pouvez consulter les dernières informations d'exécution du pipeline pour une fonction ou un groupe de fonctionnalités sousExécutions, notamment des liens rapides vers des pipelines, des exécutions, du code et d'autres informations utiles sur l'exécution.

  1. Ouvrez le groupe de fonctionnalités Pour plus d'informations, veuillez consulter Lancez Amazon SageMaker Studio.

  2. Choisissez leAccueilicône ( ) sur le panneau de gauche.

  3. Choisissez Données.

  4. Dans la liste déroulante, choisissezBoutique de fonctionnalités.

  5. Choisissez un groupe de fonctionnalités ou une fonction dont vous souhaitez voir l'exécution du pipeline.

  6. Choisissez leExécutionstable chiffrée

  7. Recherchez un pipeline à partir duSélectionnez un pipelineliste déroulante.

  8. Vous pouvez consulter les liens relatifs au pipeline, à l'exécution et aux détails du code, ainsi que le propriétaire, le statut, la date et la durée de l'exécution.

Afficher le lignage dans Studio

Vous pouvez afficher le lignage d'un groupe de fonctionnalités. Le lignage inclut les informations relatives au code d'exécution de votre flux de travail de traitement des fonctionnalités, aux sources de données utilisées et à la manière dont elles sont intégrées au groupe d'entités ou à la fonctionnalité.

  1. Ouvrez le groupe de fonctionnalités Pour plus d'informations, veuillez consulter Lancez Amazon SageMaker Studio.

  2. Choisissez leAccueilicône ( ) sur le panneau de gauche.

  3. Choisissez Données.

  4. Dans la liste déroulante, choisissezBoutique de fonctionnalités.

  5. Choisissez un groupe de fonctionnalités ou une entité dont vous souhaitez voir la lignée.

  6. Choisissez leLignéetable chiffrée

  7. Choisissez un groupe d'entités ou un nœud de pipeline pour étendre le nœud. Cela contient plus d'informations à propos d'un groupe de fonctionnalités ou d'un pipeline.

  8. Vous pouvez zoomer, dézoomer ou recentrer le graphe de lignage à l'aide des boutons situés en bas à gauche de l'écran.

  9. Vous pouvez parcourir la carte du lignage lorsque vous appuyez surOngletouShift+Tabpour passer d'un nœud à l'autre, lorsque vous choisissez des nœuds ou lorsque vous choisissez et faites glisser l'écran.

  10. Le cas échéant, vous pouvez parcourir le lignage en amont (à gauche, plus tôt) ou en aval (à droite, le plus récent) en choisissant un nœud, puis en choisissantLignage en amont, consultezouInterrogez le lignage en aval.