Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Schemas
Un esquema informa a Amazon Personalize de la estructura de sus datos y permite que Amazon Personalize analice los datos. Un esquema tiene una clave de nombre cuyo valor debe coincidir con el tipo de conjunto de datos. Una vez que se haya creado un esquema, no se podrán realizar cambios en él.
Para los grupos de conjuntos de datos de dominio, cada tipo de conjunto de datos tiene un esquema predeterminado con campos obligatorios y palabras clave reservadas. Cada vez que cree un conjunto de datos, puede usar el esquema de dominio existente o crear uno nuevo modificando el esquema predeterminado existente. Use el esquema predeterminado como guía para saber qué datos importar para su dominio. Una vez que defina el esquema y cree el conjunto de datos, no podrá realizar cambios en el esquema.
Temas
Requisitos de formato de esquema
Cuando crea un esquema para cualquiera de los conjuntos de datos de un grupo de conjuntos de datos de dominio o un grupo de conjuntos de datos personalizados, debe seguir estas directrices:
-
Debe definir el esquema en formato Avro
. Para obtener información sobre los tipos de datos de Avro que admitimos, consulte Tipos de datos de esquema. -
Los campos del esquema pueden aparecer en cualquier orden, pero deben coincidir con el orden de los encabezados de las columnas correspondientes del archivo. CSV
-
Los esquemas deben ser JSON archivos planos sin estructuras anidadas. Por ejemplo, un campo no puede ser el principal de varios subcampos.
-
Los esquemas de Amazon Personalize no admiten tipos complejos, como matrices y mapas.
-
Los campos de esquema deben tener nombres alfanuméricos únicos. Por ejemplo, no puede agregar un campo
GENRES_FIELD_1
y un campoGENRESFIELD1
a la vez. -
Debe definir campos obligatorios con sus tipos de datos obligatorios. Los campos de cadenas categóricas reservadas deben tener el atributo
categorical
establecido entrue
, mientras que los campos de cadenas reservadas no pueden ser categóricos. Las palabras clave no pueden estar en sus datos. -
Si agrega su propio campo de metadatos de tipo
string
y quiere que Amazon Personalize lo utilice durante el entrenamiento, debe incluir el atributocategorical
o el atributotextual
(solo los esquemas de elementos admiten campos con el atributo textual). -
Amazon Personalize puede utilizar columnas de cadenas no categóricas, como columnas de nombres de elementos, al generar temas, devolver metadatos en las recomendaciones y filtrar las recomendaciones. Para obtener más información, consulte Datos de cadena no categóricos.
-
Amazon Personalize no utiliza datos de tipo
boolean
al entrenar o filtrar recomendaciones. Para que Amazon Personalize utilice datos booleanos al entrenar o filtrar, utilice un campo de tipo Cadena y utilice los valores"True"
y"False"
de sus datos. También puede usar el tipo int o long, y los valores0
y1
. -
Los campos textuales deben ser del tipo
string
y deben tener el atributotextual
establecido entrue
. Para obtener más información acerca de datos de texto no estructurados, consulte Metadatos de texto no estructurado.
Los conjuntos de datos de grupos de conjuntos de datos de dominio tienen requisitos adicionales según el dominio y el tipo de conjunto de datos. Los conjuntos de datos de grupos de conjuntos de datos personalizados tienen requisitos adicionales según el tipo.
Tipos de datos de esquema
Los esquemas de Amazon Personalize admiten los siguientes tipos de Avro para los campos:
-
float
-
double
-
int
-
long
-
cadena
-
boolean
-
null
Algunos campos obligatorios y reservados admiten datos nulos. La adición de un tipo de null
a un campo le permite usar datos imperfectos (por ejemplo, metadatos con valores en blanco) para generar recomendaciones. Para obtener información sobre los campos que admiten datos nulos, consulte Esquemas y conjuntos de datos de dominio o Esquemas y conjuntos de datos personalizados. El siguiente ejemplo muestra cómo agregar un tipo nulo a un GENDER campo.
{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }