Démarrer avec Amazon SageMaker Feature Store - Amazon SageMaker

Démarrer avec Amazon SageMaker Feature Store

Pour commencer à utiliser Amazon SageMaker Feature Store, passez en revue les concepts de base, apprenez à intégrer des données pour votre Feature Store, puis parcourez un exemple de Feature Store. Les sections suivantes expliquent comment créer des groupes de fonctions, intégrer des données dans les groupes et gérer la sécurité de votre Feature Store. 

Concepts de Feature Store

La connaissance des termes suivants est essentielle pour comprendre les capacités d'Amazon SageMaker Feature Store : 

  • Feature Store : source unique de confiance pour stocker, récupérer, supprimer, suivre, partager, découvrir et contrôler l'accès aux fonctions.

  • Fonction : propriété ou caractéristique mesurable qui encapsule un phénomène observé. Dans l'API Amazon SageMaker Feature Store, une fonction est un attribut d'un enregistrement. Vous pouvez définir un nom et un type pour chaque fonction stockée dans le Feature Store. Le terme Nom identifie de manière unique une fonction dans un groupe de fonctions. Le terme Type identifie le type de données pour les valeurs de la fonction. Les types de données suivants sont pris en charge : String, Integral et Fractional. 

  • Groupe de fonctions : un FeatureGroup est la principale ressource du Feature Store. Elle contient les métadonnées de toutes les données stockées dans Amazon SageMaker Feature Store. Un groupe de fonctions est un groupement logique de fonctions, défini dans le Feature Store, pour décrire des enregistrements. La définition d'un groupe de fonctions se compose d'une liste de définitions de fonctions, d'un nom d'identificateur d'enregistrement, et de configurations pour ses boutiques en ligne et hors ligne. 

  • Définition de fonction : une FeatureDefinition se compose d'un nom et de l'un des types de données suivants : Integral, String ou Fractional. Un FeatureGroup contient une liste de définitions de fonctions. 

  • Nom d'identificateur d'enregistrement : chaque groupe de fonctions est défini par un nom d'identificateur d'enregistrement. Le nom de l'identificateur d'enregistrement doit faire référence à l'un des noms d'une fonction définie dans les définitions de fonctions du groupe de fonctions.

  • Enregistrement ; un Record est une série de valeurs de fonctions pour une valeur d'identificateur d'enregistrement unique. La combinaison d'un nom d'identificateur d'enregistrement et d'un horodatage identifie de manière unique un enregistrement dans un groupe de fonctions. 

  • Instant d'événement : un point dans le temps auquel un nouvel événement se produit et qui correspond à la création ou à la mise à jour d'un enregistrement dans un groupe de fonctions. À tous les enregistrements du groupe de fonctions doit correspondre un Eventtime. Il peut être utilisé pour effectuer le suivi d'un enregistrement au fil du temps. La boutique en ligne contient l'enregistrement correspondant au dernier Eventtime pour un nom d'identificateur d'enregistrement, tandis que la boutique hors ligne contient l'historique de tous les enregistrements. Les valeurs d'instant d'événement doivent être une chaîne ISO-8601 au format. Les formats suivants sont pris en charge : yyyy-MM-dd'T'HH:mm:ssZ et yyyy-MM-dd'T'HH:mm:ss.SSSZ, où yyyy, MM et dd représentent l'année, le mois et le jour respectivement ; et où HH, mm ss et, s'il y a lieu, SSS représentent l'heure, le mois, les secondes et les millisecondes respectivement. T et Z sont des constantes.

  • Boutique en ligne : cache à faible latence et haute disponibilité pour un groupe de fonctions, qui permet la recherche en temps réel d'enregistrements. La boutique en ligne permet d'accéder rapidement à la dernière valeur d'un Record à l'aide de l'API GetRecord. Un groupe de fonctions contient une OnlineStoreConfig qui contrôle l'emplacement de stockage des données.

  • Boutique hors ligne : la OfflineStore stocke l'historique des données dans votre compartiment S3. Elle est utilisée lorsque des lectures à faible latence (inférieure à une seconde) ne sont pas nécessaires. Par exemple, lorsque vous souhaitez stocker et servir des fonctions pour l'exploration, l'entraînement du modèle et l'inférence par lots. Un groupe de fonctions contient un OfflineStoreConfig qui contrôle l'emplacement de stockage des données.

  • Intégration : acte consistant à remplir des groupes de fonctions dans le Feature Store.