Conjuntos de datos y esquemas - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conjuntos de datos y esquemas

Amazon Personalizeconjuntos de datosson contenedores de datos. Existen tres tipos de conjuntos de datos:

  • Usuarios— Este conjunto de datos almacena metadatos sobre los usuarios. Esto podría incluir información como la edad, el sexo o el grado de fidelización, que pueden ser señales importantes en los sistemas de personalización.

  • Elementos— Este conjunto de datos almacena metadatos sobre los elementos. Esto podría incluir información como el precio, el tipo de SKU o la disponibilidad.

  • Interacciones: este conjunto de datos almacena datos históricos y en tiempo real de las interacciones entre los usuarios y los elementos. En Amazon Personalize, uninteracciónes uneventoque grabas y, a continuación, importas como datos de entrenamiento. Tanto para los grupos de conjuntos de datos de dominio como para los grupos de conjuntos de datos personalizados, debe crear como mínimo un conjunto de datos

Para todos los casos de uso (grupos de conjuntos de datos de dominio) y recetas (grupos de conjuntos de datos personalizados), los datos de interacciones deben tener lo siguiente:

  • Al menos 1000 registros de interacciones de los usuarios que interactúan con los elementos de su catálogo. Estas interacciones pueden provenir de importaciones masivas, eventos transmitidos o ambos.

  • Un mínimo de 25 ID de usuario únicos con al menos 2 interacciones para cada uno.

Los grupos de conjuntos de datos de dominio y los grupos de conjuntos de datos personalizados solo pueden tener uno de cada tipo de conjunto Antes de crear un conjunto de datos, defina un esquema para ese conjunto de datos. UNAesquemainforma a Amazon Personalize sobre la estructura de sus datos y permite que Amazon Personalize analice los datos. Un esquema tiene una clave de nombre cuyo valor debe coincidir con el tipo de conjunto de datos. Una vez que haya creado un esquema, no podrá realizar cambios en el esquema.

Para los grupos de datasets de dominio, cada tipo de conjunto de datos tiene un esquema predeterminado con campos obligatorios y palabras clave reservadas. Cada vez que crees un conjunto de datos, puedes usar el esquema de dominio existente o crear uno nuevo modificando el esquema predeterminado existente. Usa el esquema predeterminado como guía para saber qué datos importar para tu dominio. Una vez que defina el esquema y cree el conjunto de datos, no podrá realizar cambios en el esquema.

Si va a importar datos de forma masiva, estos deben almacenarse en formato CSV (valores separados por comas). La primera fila del archivo CSV debe contener encabezados de columna, que deben coincidir con el esquema.

Requisitos de formato del esquema

Al crear un esquema para un conjunto de datos en un grupo de datos de datos de datos de datos de conjunto de datos de datos de datos de conjunto de datos de datos de

  • Debe definir el esquema enFormato Avro. Para obtener información sobre los tipos de datos Avro que admitimos, consulteTipos de datos de esquema.

  • Los campos de esquema pueden aparecer en cualquier orden, pero deben coincidir con el orden de los encabezados de columna correspondientes del archivo CSV.

  • Debe definir los campos obligatorios como sus tipos de datos obligatorios. Los campos de cadenas categóricas reservadas deben tenercategoricalconfigurar paratrue, mientras que los campos de cadena reservados no pueden ser categóricos. Las palabras clave no pueden estar en tus datos. Los conjuntos de datos de grupos de conjuntos de datos de dominio tienen requisitos adicionales según el tipo de dominio y conjunto de datos Los conjuntos de datos de grupos de conjuntos de datos personalizados tienen requisitos adicionales según el tipo.

  • Los esquemas deben ser archivos JSON planos sin estructuras anidadas. Por ejemplo, un campo no puede ser el padre de varios subcampos.

  • Los campos de esquema deben tener nombres alfanuméricos únicos. Por ejemplo, no puede añadir unGENRES_FIELD_1y unGENRESFIELD1.

  • Los esquemas de Amazon Personalize no admiten tipos complejos, como arreglos y mapas.

  • Para los campos con varios valores, incluidos los metadatos categóricos y los datos de impresiones, utilice el tipo de datoscadenay separe cada valor utilizando la barra vertical, el carácter '|'. Para los campos categóricos, añada"categorical": true.

Tipos de datos de esquema

Los esquemas de Amazon Personalize admiten los siguientes tipos de Avro para los campos:

  • float

  • double

  • int

  • long

  • string

  • booleano (valores)trueyfalsedebe estar en minúsculas en sus datos)

  • null

Puede usarnullparaEVENT_VALUEyRECOMMENDATION_IDpalabras clave reservadas y campos de metadatos de interacción, usuario y elemento. Agregar unnullescribir en un campo le permite usar datos imperfectos (por ejemplo, metadatos con valores en blanco) para generar recomendaciones personalizadas. El siguiente ejemplo muestra cómo añadir un tipo nulo para un campo GENRES.

{ "name": "GENRES", "type": [ "null", "string" ], "categorical": true }