Esquemas - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Esquemas

Um esquema informa ao Amazon Personalize sobre a estrutura dos seus dados e permite que o Amazon Personalize analise os dados. Um esquema tem uma chave de nome cujo valor deve corresponder ao tipo de conjunto de dados. Depois de criar um esquema, não é possível fazer alterações no esquema.

Para grupos de conjuntos de dados de domínio, cada tipo de conjunto de dados tem um esquema padrão com campos obrigatórios e palavras-chave reservadas. Cada vez que cria um conjunto de dados, você pode usar o esquema de domínio existente ou criar um novo modificando o esquema padrão existente. Use o esquema padrão como um guia sobre quais dados importar para seu domínio. Depois de definir o esquema e criar o conjunto de dados, você não poderá fazer alterações no esquema.

Requisitos de formatação do esquema

Ao criar um esquema para um conjunto de dados em um grupo de dados de Domínio ou um grupo de dados personalizado, é necessário seguir as seguintes diretrizes:

  • É necessário definir o esquema no formato Avro. Para obter informações sobre os tipos de dados Avro compatíveis, consulte Tipos de dados do esquema.

  • Os campos de esquema podem aparecer em qualquer ordem, mas devem corresponder à ordem dos cabeçalhos de coluna no seu arquivo CSV.

  • Os esquemas devem ser arquivos JSON simples sem estruturas aninhadas. Por exemplo, um campo não pode ser o pai de vários subcampos.

  • Os esquemas do Amazon Personalize não oferecem suporte a tipos complexos, como matrizes e mapas.

  • Os campos do esquema devem ter nomes alfanuméricos exclusivos. Por exemplo, você não pode adicionar um campo GENRES_FIELD_1 e um campo GENRESFIELD1.

  • É necessário definir os campos obrigatórios como seus tipos de dados obrigatórios. Os campos de string de caracteres categóricos reservados devem ter o atributo categorical definido como true, enquanto os campos de string de caracteres reservados não podem ser categóricos. As palavras-chave não podem estar nos seus dados.

  • Se você adicionar o próprio campo de metadados do tipo string e quiser que o Amazon Personalize o use no treinamento, ele deverá incluir o atributo categorical ou textual (somente esquemas de itens aceitam campos com o atributo de texto).

  • O Amazon Personalize pode usar colunas de strings não categóricas, como colunas de nomes de itens, ao gerar temas, exibir metadados em recomendações e filtrar recomendações. Para ter mais informações, consulte Dados de string não categóricos.

  • O Amazon Personalize não usa dados do tipo boolean ao treinar ou filtrar recomendações. Para que o Amazon Personalize use dados booleanos ao treinar ou filtrar, use um campo do tipo String e use os valores "True" e "False" em seus dados. Outra opção é usar o tipo int ou long e valores 0 e 1.

  • Os campos textuais devem ser do tipo string e ter o atributo textual definido como true. Para obter mais informações sobre dados de texto não estruturados, consulte Metadados de texto não estruturados.

Os conjuntos de dados do grupo de conjuntos de dados de domínio têm requisitos adicionais com base no domínio e no tipo de conjunto de dados. Os conjuntos de dados de grupos de conjuntos de dados personalizados têm requisitos adicionais, dependendo do tipo.

Tipos de dados do esquema

Os esquemas do Amazon Personalize oferecem suporte aos seguintes tipos Avro para campos:

  • float

  • double

  • int

  • longo

  • string

  • boolean

  • null

Alguns campos obrigatórios e reservados oferecem suporte a dados nulos. Adicionar um tipo null a um campo permite que você use dados imperfeitos (por exemplo, metadados com valores em branco) para gerar recomendações. Para obter informações sobre quais campos oferecem suporte a dados nulos, consulte Conjuntos de dados de domínio e esquemas ou Conjuntos de dados personalizados e esquemas. O exemplo a seguir mostra como adicionar um tipo nulo para um campo GENDER.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }