Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Requisitos del esquema del conjunto de datos de elementos (personalizado)
Un conjunto de datos de elementos almacena metadatos acerca de los elementos de su catálogo. Esto puede incluir información como el precio, el género y la disponibilidad de cada elemento. Para obtener información sobre los tipos de datos de elementos que puede importar en Amazon Personalize, consulte Conjunto de datos de elementos.
Los datos que proporciones para cada elemento deben coincidir con su esquema de conjunto de datos de elementos. Como mínimo, debe proporcionar un ID de elemento para cada usuario (longitud máxima de 256 caracteres). Según su esquema, los metadatos de elementos pueden incluir valores nulos o vacíos. El esquema de usuarios debe tener como mínimo un campo de metadatos, pero si agrega un tipo null
, este valor puede ser nulo para el elemento. Tiene la libertad de añadir campos adicionales según su caso de uso y sus datos. Siempre que los campos no figuren como obligatorios o reservados, y los tipos de datos figuren en Tipos de datos de esquema, puede elegir los nombres de los campos y los tipos de datos.
Para usar datos categóricos, agregue un campo de tipo string
y establezca el atributo categórico del campo en true
en su esquema. A continuación, incluya los datos categóricos en su archivo CSV masivo y en las importaciones de elementos individuales. Los valores categóricos pueden tener 1000 caracteres como máximo. Si tiene un elemento con un valor categórico con más de 1000 caracteres, se generará un error en su trabajo de importación del conjunto de datos.
Para los elementos con varias categorías, separe cada valor con la barra vertical, “|”. Por ejemplo, para un campo GENRES, los datos para un elemento podrían ser Action|Crime|Biopic
. Si tiene varios niveles de datos categóricos y algunos elementos tienen varias categorías para cada nivel de la jerarquía, agregue un campo para cada nivel y un indicador de nivel después del nombre de cada campo: GENRES, GENRE_L2, GENRE_L3. Esto le permite filtrar las recomendaciones en función de las subcategorías, incluso si un elemento pertenece a varias categorías de múltiples niveles (para obtener información sobre la creación y el uso de filtros, consulte Recomendaciones de filtrado y segmentos de usuarios). Por ejemplo, un vídeo puede tener los siguientes datos para cada nivel de categoría:
-
GENRES: Acción|Aventura
-
GENRE_L2: Crimen|Western
-
GENRE_L3: Biopic
En este ejemplo, el vídeo está en la jerarquía acción > crimen > biopic y la jerarquía aventura > western > biopic. Recomendamos usar solo hasta L3, pero puede usar más niveles si es necesario.
Durante el entrenamiento de modelos, Amazon Personalize considera un máximo de 750 000 elementos. Si importa más de 750 000 elementos, Amazon Personalize decide qué elementos incluir en el entrenamiento, haciendo hincapié en incluir elementos nuevos (elementos que ha añadido recientemente sin interacciones) y elementos existentes con datos de interacciones recientes.
Para obtener más información sobre los requisitos mínimos y los límites máximos de datos para un conjunto de datos de elementos, consulte Cuotas de servicio.
Ejemplo de esquema de conjunto de datos de elementos (personalizado)
En el siguiente ejemplo se muestra cómo estructurar un esquema de elementos. El campo ITEM_ID
es obligatorio. El campo GENRE
son metadatos categóricos y el campo DESCRIPTION
son metadatos textuales. Se requiere un campo de metadatos como mínimo. Puede agregar un máximo de 100 campos de metadatos. El campo CREATION_TIMESTAMP
es una palabra clave reservada. Para obtener información sobre los requisitos de esquema, consulte Requisitos de esquemas y conjuntos de datos personalizados.
{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }, ], "version": "1.0" }
Para este esquema, las primeras líneas de datos históricos de un archivo CSV pueden tener el siguiente aspecto.
ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...