Conjuntos de datos y esquemas - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conjuntos de datos y esquemas

Los conjuntos de datos de Amazon Personalize son contenedores de datos. Existen cinco tipos de conjuntos de datos:

  • Interacciones de elementos: este conjunto de datos almacena datos históricos y en tiempo real de las interacciones entre los usuarios y los elementos. En Amazon Personalize, una interacción es un evento que se registra y, a continuación, se importa como datos de entrenamiento. Tanto para los grupos de conjuntos de datos de dominio como para los grupos de conjuntos de datos personalizados, debe crear como mínimo un conjunto de datos de interacciones de elementos.

  • Usuarios: este conjunto de datos almacena metadatos sobre sus usuarios. Esto puede incluir información como la edad, el sexo, el grado de fidelización o el título del elemento.

  • Elementos: este conjunto de datos almacena metadatos sobre sus elementos. Esto podría incluir información, como el precio, el tipo de SKU o la disponibilidad.

  • Acciones: este conjunto de datos almacena metadatos sobre sus acciones. Una acción es una actividad de interacción que puede que quiera recomendar a sus clientes. Entre las acciones puede incluirse instalar su aplicación móvil, completar un perfil de pertenencia a grupo, unirse a un programa de fidelización o registrarse para recibir correos electrónicos promocionales. Para la receta Next-Best-Action, se requiere el conjunto de datos de acciones. Ninguna otra receta personalizada ni caso de uso de dominio utiliza datos de acciones.

  • Interacciones de acciones: este conjunto de datos almacena datos históricos y en tiempo real de las interacciones entre los usuarios y las acciones. La receta Next-Best-Action utiliza estos datos y los de su conjunto de datos de acciones para recomendar acciones a los usuarios. Ninguna otra receta personalizada ni caso de uso de dominio utiliza datos de acciones-interacciones.

Cada grupo de conjuntos de datos solo puede tener un conjunto de datos de cada tipo. No puede crear los siguientes recursos de mejor acción, incluidos los conjuntos de datos de acciones e interacciones de acciones, en un grupo de conjuntos de datos de dominio. Amazon Personalize almacena sus datos en conjuntos de datos hasta que los elimine. Para todos los casos de uso (grupos de conjuntos de datos de dominio) y recetas (grupos de conjuntos de datos personalizados), los datos de sus interacciones deben tener lo siguiente:

  • Como mínimo, 1000 registros de interacciones de elementos de los usuarios que interactúan con los elementos de su catálogo. Estas interacciones pueden provenir de importaciones masivas, de eventos transmitidos o ambos.

  • Como mínimo, 25 ID de usuarios únicos con al menos dos interacciones de elementos para cada uno.

Para obtener recomendaciones de calidad, le sugerimos que tenga al menos 50 000 interacciones de elementos de al menos 1000 usuarios, con dos o más interacciones de elementos cada uno.

Antes de crear un conjunto de datos, debe definir un esquema para dicho conjunto de datos. Un esquema informa a Amazon Personalize de la estructura de sus datos y permite que Amazon Personalize analice los datos. Un esquema tiene una clave de nombre cuyo valor debe coincidir con el tipo de conjunto de datos. Una vez que se haya creado un esquema, no se podrán realizar cambios en él.

Para los grupos de conjuntos de datos de dominio, cada tipo de conjunto de datos tiene un esquema predeterminado con campos obligatorios y palabras clave reservadas. Cada vez que cree un conjunto de datos, puede usar el esquema de dominio existente o crear uno nuevo modificando el esquema predeterminado existente. Use el esquema predeterminado como guía para saber qué datos importar para su dominio. Una vez que defina el esquema y cree el conjunto de datos, no podrá realizar cambios en el esquema.

Si va a importar datos de forma masiva, los datos se deben almacenar en formato CSV (valores separados por comas). La primera fila del archivo CSV debe contener los encabezados de las columnas, que deben coincidir con el esquema. Para obtener información sobre cómo aplicar formato a sus datos masivos para Amazon Personalize, Directrices de formato de datos.