Création de groupes de fonctions - Amazon SageMaker

Création de groupes de fonctions

Un FeatureGroup est la ressource principale fdu Feature Store. Elle contient les métadonnées de toutes les données stockées dans Amazon SageMaker Feature Store. Un groupe de fonctions est un groupement logique de fonctions, défini dans le Feature Store, pour décrire les enregistrements. La définition d'un groupe de fonctions se compose d'une liste de définitions de fonctions, d'un nom d'identificateur d'enregistrement et de configurations pour ses boutiques en ligne et hors ligne. L'exemple de code de cette rubrique utilise le kit SDK SageMaker Python. Les API sous-jacentes sont disponibles pour les développeurs utilisant d'autres langages.

Avant d'utiliser un Feature Store, vous chargez généralement votre jeu de données, exécutez des transformations et configurez vos fonctions en vue de l'intégration. Ce processus peut varier beaucoup et dépend énormément de vos données. L'exemple de code de la rubrique suivante fait référence aux exemples de blocs-notes Introduction to Feature Store (Introduction à Feature Store) et Fraud Detection with Amazon SageMaker Feature Store (Détection de fraude avec Amazon SageMaker Feature Store), respectivement. Nous vous recommandons d'exécuter ce bloc-notes dans Amazon SageMaker Studio, car le code de ce guide est conceptuel et ne fonctionne pas entièrement s'il est copié.

Le Feature Store prend en charge les types de données suivants :String, Fractional (valeur à virgule flottante IEEE 64 bits), et Integral (Int64 - valeur intégrale signée 64 bits). Le type par défaut est défini à String. Cela signifie que, si une colonne de votre jeu de données n'est pas du type float ou long, elle est du type String par défaut dans votre Feature Store.

Vous pouvez utiliser un schéma pour décrire les colonnes et les types de données de vos données. Vous transmettez ce schéma dans FeatureDefinitions, un paramètre obligatoire pour un FeatureGroup. Vous pouvez utiliser le kit SDK SageMaker Python, qui peut détecter automatiquement les types de données lorsque vous utilisez la fonction load_feature_definitions

Le comportement par défaut lorsqu'un nouvel enregistrement de fonctions est ajouté avec un ID d'enregistrement existant est le suivant. Dans la boutique hors ligne, le nouvel enregistrement sera ajouté. Dans la boutique en ligne, si l'instant d'événement du nouvel enregistrement est inférieur à l'instant d'événement existant, rien ne se produit. Mais, si l'instant d'événement du nouvel enregistrement est supérieur ou égal à l'instant d'événement existant, l'enregistrement est réécrit.