Sustituir el esquema de un conjunto de datos para añadir nuevas columnas - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Sustituir el esquema de un conjunto de datos para añadir nuevas columnas

Después de crear un conjunto de datos de elementos o usuarios, puede reemplazar su esquema por uno nuevo o uno ya existente. Puede reemplazar el esquema de un conjunto de datos si su estructura de datos cambió después de crear el conjunto de datos. Por ejemplo, puede tener una nueva columna de metadatos de elementos que desee que Amazon Personalize tenga en cuenta durante el entrenamiento. O tal vez quiera añadir una columna de datos para utilizarla únicamente al filtrar las recomendaciones.

Al reemplazar el esquema de un conjunto de datos, debe conservar todos los campos del esquema anterior y no puede cambiar sus tipos de datos o atributos. Tras reemplazar el esquema de un conjunto de datos, Amazon Personalize excluye automáticamente del entrenamiento cualquier columna nueva para cualquier recomendador o solución personalizada existente. Para obtener más pautas y requisitos, consulte Directrices y requisitos.

Puede reemplazar el esquema de un conjunto de datos por la consola Amazon Personalize, AWS Command Line Interface (AWS CLI) y AWS los SDK.

Directrices y requisitos

Antes de reemplazar el esquema para un conjunto de datos, asegúrese de que conoce las siguientes pautas y requisitos:

  • No se puede reemplazar el esquema de un conjunto de datos de interacciones de elementos, un conjunto de datos de interacciones de acción o un conjunto de datos de acciones.

  • Puede añadir nuevos campos al esquema de reemplazo, pero debe conservar todos los campos del esquema anterior. Y no puede cambiar sus tipos de datos o atributos. Por ejemplo, si el esquema anterior incluye un campo MEMBERSHIP_STATUS para cadenas de datos categóricos, el nuevo esquema que utilice debe incluir un campo MEMBERSHIP_STATUS con estos atributos y tipos de datos.

  • Si el esquema actual tiene un campo al que desea cambiar el nombre, o si desea cambiar sus tipos de datos o atributos, puede agregar un campo nuevo con un nombre nuevo y tipos o atributos modificados. A continuación, incluya el campo nuevo en el entrenamiento y excluya el campo anterior. Todos los campos nuevos deben admitir datos null. Si el campo anterior no admitía datos de anulación, al importar datos, puede usar datos de marcador de posición para asegurarse de que la importación coincide con el esquema. Para obtener información sobre la configuración de las columnas utilizadas por un recomendador, consulte Actualización de un recomendador. Para obtener información sobre la configuración de las columnas utilizadas por una solución, consulte Configuración de las columnas que se utilizan en el entrenamiento.

  • Todos los campos nuevos deben admitir datos null. Para obtener más información acerca de cómo añadir un tipo nulo a un campo, consulte Tipos de datos de esquema.

  • Tras reemplazar el esquema de un conjunto de datos, Amazon Personalize excluye automáticamente del entrenamiento cualquier columna nueva para cualquier recomendador o solución personalizada existente. El uso del conjunto de datos modificado implica las siguientes acciones:

    • Para usar cualquier columna nueva en el entrenamiento, importe los datos que se alineen con el nuevo esquema. A continuación, actualice las columnas recomendadas para que usen columnas nuevas o cree una nueva solución personalizada y configure las columnas que usará durante el entrenamiento.

      Para obtener información sobre la actualización de las columnas utilizadas por un recomendador, consulte Actualización de un recomendador. Para obtener información sobre la configuración de las columnas utilizadas por una solución, consulte Configuración de las columnas que se utilizan en el entrenamiento.

    • Para usar cualquier columna solo al filtrar, importe los datos que se alineen con el nuevo esquema, cree un filtro que utilice los nuevos datos y aplique el filtro a las solicitudes de recomendación. No necesita actualizar ningún recomendador ni crear o actualizar ningún recurso personalizado.

Sustitución del esquema de un conjunto de datos (consola)

Para sustituir el esquema de un conjunto de datos por la consola de Amazon Personalize, debe elegir el conjunto de datos que desee modificar y sustituirlo por un esquema nuevo o utilizar uno existente.

Para reemplazar el esquema de un conjunto de datos
  1. Abra la consola de Amazon Personalize en https://console.aws.amazon.com/personalize/home e inicie sesión en su cuenta.

  2. En la página Grupos de conjuntos de datos, elija su grupo de conjuntos de datos.

  3. En el panel de navegación, elija Conjuntos de datos y elija el botón de opción correspondiente al conjunto de datos que desee modificar.

  4. Elija Acciones y, a continuación, elija Reemplazar esquema.

  5. En Detalles del esquema, elija reemplazarlo por un esquema nuevo o por uno creado anteriormente.

  6. Especifique el nuevo esquema que se va a utilizar. Si ha optado por:

    • Sustituir por un esquema nuevo, asígnele un nombre y, en la Definición de esquema, realice los cambios en el JSON del esquema.

    • Usar un esquema creado anteriormente, en Esquema creado anteriormente, elija el esquema que quiere usar. Solo se muestran los esquemas que reúnen las condiciones. Para obtener información sobre los requisitos de esquema, consulte Directrices y requisitos.

  7. Elija Reemplazar. Cuando el conjunto de datos esté activo, puede empezar a importar datos que se alineen con el nuevo esquema. Para obtener más información, consulte Paso 2: Preparación e importación de datos.

Sustitución del esquema de un conjunto de datos (AWS CLI)

Para reemplazar el esquema de un conjunto de datos por el AWS CLI, usa el update-dataset comando que especifica el nombre de recurso de Amazon (ARN) del conjunto de datos que se va a actualizar y el ARN del nuevo esquema que se va a usar. No se puede actualizar el esquema de un conjunto de datos de interacciones de elementos, un conjunto de datos de interacciones de acciones o un conjunto de datos de acciones.

El siguiente código muestra cómo actualizar el esquema de un conjunto de datos con AWS CLI. Para reemplazar el esquema de un conjunto de datos por uno nuevo, use primero el comando create-schema. A continuación, utilice el siguiente código para reemplazar el esquema actual por el nuevo. Para obtener información sobre cómo crear un esquema con el AWS CLI, consulte. Creación de un conjunto de datos y un esquema (AWS CLI) Para obtener información sobre los conjuntos de datos y los requisitos del esquema, consulte Schemas.

aws personalize update-dataset \ --dataset-arn Dataset ARN \ --schema-arn New schema ARN

Cuando el conjunto de datos esté activo, puede empezar a importar datos que se alineen con el nuevo esquema. Para obtener más información, consulte Paso 2: Preparación e importación de datos. Para obtener información sobre la última actualización del conjunto de datos, puede utilizar la operación DescribeDataset.

Sustituir el esquema de un conjunto de datos (AWS SDK)

Para reemplazar el esquema de un conjunto de datos por los AWS SDK, se usa la operación UpdateDataset API. Especifique el nombre de recurso de Amazon (ARN) del conjunto de datos que desea actualizar y el esquema nuevo que desea utilizar. No se puede actualizar el esquema de un conjunto de datos de interacciones de elementos, un conjunto de datos de interacciones de acciones o un conjunto de datos de acciones.

El código siguiente muestra cómo reemplazar el esquema de un conjunto de datos por el SDK para Python (Boto3). Para reemplazar el esquema de un conjunto de datos por uno nuevo, use primero la operación CreateSchema. A continuación, utilice el siguiente código para reemplazar el esquema actual por el nuevo. Para obtener información sobre cómo crear un esquema con los AWS SDK, consulte. Crear un conjunto de datos y un esquema (AWS SDK) Para obtener información sobre los requisitos de los conjuntos de datos y el esquema, consulte Schemas.

import boto3 personalize = boto3.client('personalize') update_dataset_response = personalize.update_dataset( datasetArn = 'dataset_arn', schemaArn = 'new_schema_arn' ) print(update_dataset_response)

Cuando el conjunto de datos esté activo, puede empezar a importar datos que se alineen con el nuevo esquema. Para obtener más información, consulte Paso 2: Preparación e importación de datos. Para obtener información sobre la última actualización del conjunto de datos, puede utilizar la operación DescribeDataset.