Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Preparación de los metadatos de usuario para el entrenamiento - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preparación de los metadatos de usuario para el entrenamiento

Los datos de usuario que puede importar en Amazon Personalize incluyen metadatos numéricos, como la edad de los usuarios, y categóricos, como el sexo o el grado de fidelización. Los metadatos sobre los usuarios se importan en un conjunto de datos de Usuarios de Amazon Personalize.

Según el caso de uso de dominio o la receta personalizada, los metadatos de usuario pueden ayudar a Amazon Personalize a recomendar elementos más relevantes a los usuarios o a recomendar segmentos de usuarios más significativos. Además, después del entrenamiento, pueden ayudar al modelo a recomendar elementos a los usuarios sin datos de interacciones. Para obtener más información sobre qué casos de uso o recetas utilizan metadatos de usuario, consulte los requisitos de datos para el caso de uso de dominio o la receta en Correlación del caso de uso con los recursos de Amazon Personalize.

En el entrenamiento, Amazon Personalize no usa datos de usuario de cadena no categóricos, como nombres de usuario, palabras clave sobre el usuario o etiquetas. Sin embargo, la importación de estos datos aún puede mejorar las recomendaciones. Para obtener más información, consulte Datos de cadena no categóricos.

En todos los casos de uso de dominio y recetas personalizadas, los datos de usuario masivos deben estar en un archivo CSV. Cada fila del archivo debe representar a un usuario único. Después de finalizar la preparación de los datos, podrá crear un archivo JSON de esquema. Este archivo informa a Amazon Personalize de la estructura de los datos. Para obtener más información, consulte Creación de archivos JSON de esquema para los esquemas de Amazon Personalize.

En las siguientes secciones se proporciona más información sobre cómo preparar los datos de usuario para Amazon Personalize. Para ver las directrices de formato de datos masivos para todos los tipos de datos, consulte las directrices de formato de datos masivos

Requisitos de datos de usuario

A continuación, se indican los requisitos de datos de usuario para Amazon Personalize. Tiene la libertad de agregar campos personalizados adicionales según el caso de uso y los datos.

  • Los datos deben tener una columna USER_ID que almacene el identificador único de cada usuario. Cada usuario debe tener un ID de usuario. Debe tener un tipo string con una longitud máxima de 256 caracteres.

  • Los datos deben tener al menos una columna de cadenas categóricas o de metadatos numéricos. Las columnas de metadatos de usuario pueden incluir valores vacíos o nulos para algunos usuarios. Se recomienda que estas columnas estén completadas en un 70 % como mínimo.

  • El número máximo de columnas de metadatos es 25.

Si no está seguro de tener suficientes datos o si tiene dudas sobre la calidad, puede importar los datos a un conjunto de datos de Amazon Personalize y utilizar Amazon Personalize para analizarlos. Para obtener más información, consulte Análisis de la calidad y la cantidad de datos en los conjuntos de datos de Amazon Personalize.

Metadatos categóricos

Con algunas recetas y todos los casos de uso de dominio, Amazon Personalize utiliza metadatos categóricos, como el sexo del usuario, los intereses o el estado de pertenencia, para identificar los patrones subyacentes que revelan los elementos más relevantes para los usuarios. Puede definir su propio rango de valores en función de su caso de uso. Los metadatos categóricos pueden estar en cualquier idioma.

Para los usuarios con varias categorías, separe cada valor con la barra vertical, “|”. Por ejemplo, en el caso de un campo INTERESTS, los datos de un usuario pueden ser Movies|TV Shows|Music.

Con todas las recetas y dominios, puede importar metadatos categóricos y utilizarlos para filtrar las recomendaciones en función de los atributos de un usuario. Para obtener información acerca del filtrado de recomendaciones, consulte Recomendaciones de filtrado y segmentos de usuarios.

Los valores categóricos pueden tener 1000 caracteres como máximo. Si tiene un usuario con un valor categórico con más de 1000 caracteres, se generará un error en su trabajo de importación del conjunto de datos.

Datos de cadena no categóricos

A excepción de los ID de usuario, Amazon Personalize no usa datos de cadena no categóricos al realizar el entrenamiento, como nombres de usuario, palabras clave sobre el usuario o etiquetas. Sin embargo, Amazon Personalize puede usarlos al filtrar recomendaciones. Puede crear filtros para incluir o eliminar elementos de las recomendaciones en función de los datos de cadena no categóricos sobre el usuario para el que obtiene recomendaciones (CurrentUser). Para obtener más información acerca de los filtros, consulte Recomendaciones de filtrado y segmentos de usuarios. Los valores no categóricos pueden tener 1000 caracteres como máximo.

Ejemplo de metadatos de usuarios

Las primeras líneas de metadatos de usuario de un archivo CSV pueden tener el siguiente aspecto.

USER_ID,AGE,GENDER,INTEREST 5,34,Male,hiking 6,56,Female,music 8,65,Male,movies|TV shows|music ... ...

La columna USER_ID es obligatoria y almacena identificadores únicos para cada usuario individual. La columna AGE son metadatos numéricos. Las columnas GENDER y INTEREST almacenan metadatos categóricos para cada usuario.

Después de finalizar la preparación de los datos, podrá crear un archivo JSON de esquema. Este archivo informa a Amazon Personalize de la estructura de los datos. Para obtener más información, consulte Creación de archivos JSON de esquema para los esquemas de Amazon Personalize. Este es el aspecto que tendría el archivo JSON de esquema para los datos de ejemplo anteriores.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true }, { "name": "INTEREST", "type": "string", "categorical": true } ], "version": "1.0" }
PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.