Conjunto de datos de elementos - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conjunto de datos de elementos

Entre los datos de elementos que puede importar en Amazon Personalize se incluyen metadatos numéricos y categóricos, como la marca de tiempo de creación, el precio, el género, la descripción y la disponibilidad. Importa metadatos sobre sus elementos en un conjunto de datos de elementos de Amazon Personalize.

En el entrenamiento, Amazon Personalize no usa datos de elementos de cadenas no categóricos, como títulos de elementos o datos del autor. Sin embargo, algunas características de Amazon Personalize utilizan estos datos para mejorar las recomendaciones. Para obtener más información, consulte Datos de cadena no categóricos.

El número máximo de columnas de metadatos es 100. El número máximo de artículos que Amazon Personalize considera durante el entrenamiento depende de tu caso de uso o receta. Solo los elementos considerados durante el entrenamiento pueden aparecer en las recomendaciones.

  • En el caso de la versión 2 de personalización de usuario o la versión 2 de clasificación personalizada, el número máximo de elementos que un modelo tiene en cuenta durante el entrenamiento es de 5 millones. Estos elementos provienen del conjunto de datos de elementos y de interacciones entre elementos.

  • Para todos los casos de uso y recetas personalizadas de dominios distintos de la versión 2 de personalización de usuario y la versión 2 de clasificación personalizada, el número máximo de elementos que un modelo tiene en cuenta durante el entrenamiento y la generación de recomendaciones es de 750 000.

Para obtener más información sobre los requisitos de las Elección de una receta recetas, consulte.

Este tema proporciona información sobre los siguientes tipos de datos de elementos:

Datos de marca temporal de creación

Amazon Personalize utiliza los datos de marca temporal de creación (en formato de tiempo Unix, en segundos) para calcular la antigüedad de un elemento y ajustar las recomendaciones en consecuencia.

Si faltan los datos de marca de tiempo de creación para uno o más elementos, Amazon Personalize deduce esta información a partir de los datos de interacción, si los hay, y utiliza la marca de tiempo de los datos de interacción más antiguos del elemento como la marca de tiempo de creación del elemento. Si un elemento no tiene datos de interacción, su marca de tiempo de creación se establece como la marca de tiempo de la última interacción del conjunto de entrenamiento y Amazon Personalize lo considera un elemento nuevo.

Metadatos categóricos

Con determinadas recetas y dominios, Amazon Personalize utiliza metadatos categóricos, como el género o el color de un elemento, a la hora de identificar los patrones subyacentes que revelan los elementos más relevantes para sus usuarios. Puede definir su propio rango de valores en función de su caso de uso. Los metadatos categóricos pueden estar en cualquier idioma.

Con todas las recetas y dominios, puede importar datos categóricos y usarlos para filtrar las recomendaciones en función de los atributos de un elemento. Para obtener más información acerca del filtrado de recomendaciones, consulte Recomendaciones de filtrado y segmentos de usuarios.

Los valores categóricos pueden tener una longitud máxima de 1000 caracteres. Si tiene un elemento con un valor categórico con más de 1000 caracteres, se generará un error en su trabajo de importación del conjunto de datos.

En el caso de los grupos de conjuntos de datos de dominio, los dominios tanto de VIDEO_ON_DEMAND como de ECOMMERCE utilizan metadatos categóricos. Para grupos de conjuntos de datos personalizados y soluciones personalizadas, entre las recetas que utilizan metadatos categóricos se incluyen las siguientes:

Metadatos de texto no estructurado

Con determinadas recetas y dominios, Amazon Personalize puede extraer información significativa de metadatos de texto no estructurado, como descripciones de productos, reseñas de productos o sinopsis de películas. Amazon Personalize utiliza texto no estructurado para identificar los elementos relevantes para los usuarios, en particular cuando los elementos son nuevos o tienen menos datos de interacciones. Incluya datos de texto no estructurado en su conjunto de datos de elementos para aumentar las tasas de clics y las tasas de conversación para los nuevos elementos de su catálogo.

Para usar datos no estructurados, agregue un campo con tipo string a su esquema de elementos y establezca el atributo textual del campo en true. Puede añadir 1 campo textual como máximo. A continuación, incluya los datos de texto en su archivo CSV masivo y en las importaciones de elementos individuales.

En el caso de archivos CSV masivos, escribe el texto entre comillas dobles y elimina los caracteres de línea nuevos. Utilice el carácter \ para aplicar escape en cualquier comilla doble o carácter \ en los datos. Para ver un ejemplo de un esquema de elementos con un campo para datos de texto no estructurados, consulte Ejemplo de esquema de conjunto de datos de elementos (personalizado). Amazon Personalize trunca los campos de texto al límite de caracteres. Asegúrese de que la información más relevante del texto se encuentre al principio del campo. Para obtener información acerca de la importación de datos en Amazon Personalize, consulte Paso 2: Preparación e importación de datos.

Los valores de texto no estructurado pueden tener como máximo 20 000 caracteres en todos los idiomas, excepto en chino y japonés. Para el chino y el japonés, puede tener como máximo 7000 caracteres. Amazon Personalize trunca los valores que superan el límite de caracteres al límite de caracteres.

El texto puede estar en los siguientes idiomas:

  • Chino simplificado

  • Chino tradicional

  • Inglés

  • Francés

  • Alemán

  • Japonés

  • Portugués

  • Español

Puede enviar elementos de texto no estructurado en varios idiomas, pero el texto de cada elemento debe estar en un solo idioma.

En el caso de los grupos de conjuntos de datos de dominio, tanto los dominios de VIDEO_ON_DEMAND como los de ECOMMERCE utilizan metadatos textuales. Para los grupos de conjuntos de datos personalizados y las soluciones personalizadas, entre las recetas que utilizan metadatos textuales se incluyen las siguientes:

Datos de cadena no categóricos

A excepción de los ID de los elementos, Amazon Personalize no usa datos de cadenas no categóricos al realizar el entrenamiento, como títulos de elementos o datos del autor. Sin embargo, Amazon Personalize puede usarlos con las siguientes características:

  • Amazon Personalize puede incluir metadatos de los elementos en las recomendaciones, incluidos valores de cadena no categóricos. Puede usar los metadatos para enriquecer las recomendaciones de la interfaz de usuario, por ejemplo, agregar el nombre del director al carrusel de recomendaciones de una película. Para obtener más información, consulte Metadatos de los artículos en las recomendaciones.

  • Si usa Similar-Items, puede generar recomendaciones por lotes con temas. Al generar recomendaciones por lotes con temas, debe especificar una columna de nombre del elemento en el trabajo de inferencia por lotes. Para obtener más información, consulte Recomendaciones por lotes con temas del Generador de contenidos.

  • Puede crear filtros para incluir o quitar elementos de las recomendaciones en función de los datos de cadena no categóricos. Para obtener más información acerca de los filtros, consulte Recomendaciones de filtrado y segmentos de usuarios.