Adición de características y registros a un grupo de características - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Adición de características y registros a un grupo de características

Puedes usar la API de Amazon SageMaker Feature Store o la consola para actualizar y describir tu grupo de características, así como para añadir características y registros a tu grupo de características. Un grupo de características es un objeto que contiene sus datos y una característica describe una columna de la tabla. Al agregar una característica al grupo de características, en efecto, se añade una columna a la tabla. Al agregar un registro nuevo al grupo de características, repone los valores de las características asociadas a un identificador de registro concreto. Para obtener más información sobre los conceptos del almacén de características, consulte Conceptos del almacén de características.

Una vez que haya agregado correctamente las características a un grupo de características, no podrá eliminarlas. Las características que haya agregado no añaden ningún dato a sus registros. Puedes añadir nuevos registros al grupo de características o sobrescribirlos mediante la PutRecordAPI. Para ver ejemplos sobre cómo actualizar, describir y colocar registros en un grupo de características, consulte Código de ejemplo.

Puede usar la consola para añadir entidades a un grupo de entidades. Para obtener más información sobre cómo actualizar los grupos de características mediante la consola, consulteActualiza un grupo de características desde la consola.

En las siguientes secciones se proporciona una descripción general del uso de las API del almacén de características para agregar características a un grupo de características, seguida de ejemplos. Con la API, también puede agregar o sobrescribir registros después de actualizar el grupo de características.

API

Utilice la operación UpdateFeatureGroup o para agregar características a un grupo de características.

Puede usar la operación DescribeFeatureGroup para comprobar si ha agregado las características correctamente.

Para agregar o sobrescribir registros, utilice la operación PutRecord.

Para ver las actualizaciones que ha realizado en un registro, utilice la operación GetRecord. Para ver las actualizaciones que ha realizado en varios registros, utilice la operación BatchGetRecord. Pueden pasar hasta cinco minutos hasta que aparezcan las actualizaciones que ha realizado.

Puede usar el código de ejemplo de la siguiente sección para ver cómo agregar características y registros mediante el AWS SDK for Python (Boto3).

Código de ejemplo

El código de ejemplo le guiará por el siguiente proceso:

  1. Agregar características al grupo de características

  2. Verificar que las haya agregado correctamente

  3. Agregar un registro al grupo de características

  4. Verificar que lo haya agregado correctamente

Paso 1: Agregar características y registros a un grupo de características

El código siguiente utiliza la operación UpdateFeatureGroup para agregar nuevas características al grupo de características. Se supone que ha configurado el almacén de características y ha creado un grupo de características. Si necesita más información sobre cómo comenzar, consulte Introducción al cuaderno de ejemplo del almacén de características.

import boto3 sagemaker_client = boto3.client("sagemaker") sagemaker_client.update_feature_group( FeatureGroupName=feature_group_name, FeatureAdditions=[ {"FeatureName": "new-feature-1", "FeatureType": "Integral"}, {"FeatureName": "new-feature-2", "FeatureType": "Fractional"}, {"FeatureName": "new-feature-3", "FeatureType": "String"} ] )

El código siguiente utiliza la operación DescribeFeatureGroup para comprobar el estado de la actualización. Si el campo LastUpdateStatus es Successful, significa que ha agregado las características correctamente.

sagemaker_client.describe_feature_group( FeatureGroupName=feature_group_name )

Paso 2: Agregar un registro nuevo al grupo de características

El siguiente código utiliza la operación PutRecord para agregar registros al grupo de características que ha creado.

record_identifier_value = 'new_record' sagemaker_featurestore_runtime_client = boto3.client("sagemaker-featurestore-runtime") sagemaker_runtime_client.put_record( FeatureGroupName=feature_group_name, Record=[ { 'FeatureName': "record-identifier-feature-name", 'ValueAsString': record_identifier_value }, { 'FeatureName': "event-time-feature", 'ValueAsString': "timestamp-that-feature-store-returns" }, { 'FeatureName': "new-feature-1", 'ValueAsString': "value-as-string" }, { 'FeatureName': "new-feature-2", 'ValueAsString': "value-as-string" }, { 'FeatureName': "new-feature-3", 'ValueAsString': "value-as-string" }, ] )

Utilice la operación GetRecord para ver qué registros de su grupo de características no tienen datos de las características que ha agregado. Puede usar la operación PutRecord para sobrescribir los registros que no contienen datos de las características que ha agregado.