Conjuntos de dados personalizados e esquemas - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Conjuntos de dados personalizados e esquemas

Ao criar um grupo de conjuntos de dados personalizados, você cria seus próprios esquemas do zero. Os conjuntos de dados e esquemas de grupos de dados personalizados têm menos campos obrigatórios e mais flexibilidade. Os tópicos a seguir explicam os requisitos de esquema e dados para os conjuntos de dados de um grupo de conjuntos de dados personalizados. Cada seção do conjunto de dados lista os dados necessários para o tipo de conjunto de dados e fornece um exemplo de esquema em JSON.

Para obter informações sobre os tipos de dados que você pode importar para o Amazon Personalize, consulte Tipos de dados que o Amazon Personalize pode usar. Para obter informações sobre os requisitos gerais de esquema do Amazon Personalize, como requisitos de formatação e tipos de dados de campo disponíveis, consulte Criar arquivos JSON de esquema para esquemas do Amazon Personalize. Esses requisitos aplicam-se a todos os esquemas do Amazon Personalize.

Requisitos de conjuntos de dados personalizados e esquemas

Quando você cria um conjunto de dados para um grupo de conjuntos de dados personalizados, cada tipo de conjunto de dados tem os seguintes campos obrigatórios e palavras-chave reservadas com os tipos de dados obrigatórios.

Tipo de conjunto de dados Campos obrigatórios Palavras-chave reservadas
Interações com itens (exemplo de esquema)

USER_ID (string)

ITEM_ID (string)

TIMESTAMP (long)

EVENT_TYPE (string)

EVENT_VALUE (float, null)

IMPRESSION (string, null)

RECOMMENDATION_ID (string, null)

EVENT_ATTRIBUTION_SOURCE (string, null)

Usuários (exemplo de esquema)

USER_ID (string)

1 campo de metadados (string categórico ou numérico)

Itens (exemplo de esquema)

ITEM_ID (string)

1 campo de metadados (campo string categórico ou textual ou campo numérico)

CREATION_TIMESTAMP (long)

Ações (exemplo de esquema)

ACTION_ID (string)

1 campo de metadados (string categórico ou numérico)

CREATION_TIMESTAMP (long)

VALUE (long, null)

TYPE (string, null)

EXPIRATION_TIMESTAMP (long, null)

REPEAT_FREQUENCY (long, null)

Interações com ações (exemplo de esquema)

USER_ID (string)

ACTION_ID (string)

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (string, null)

RECOMMENDATION_ID (string, null)

Campos de metadados

Os metadados incluem campos com ou sem string de caracteres que não são obrigatórios ou não usam uma palavra-chave reservada. Os esquemas de metadados têm as seguintes restrições:

  • Os esquemas de Usuários, Itens e Ações exigem pelo menos um campo de metadados.

  • É possível adicionar, no máximo, 25 campos de metadados para um esquema de usuários e 100 campos de metadados para um esquema de ações.

  • Se você adicionar seu próprio campo de metadados do tipo string, ele deverá incluir o atributo categorical ou o atributo textual (somente os esquemas de itens oferecem suporte a campos com o atributo textual). Caso contrário, o Amazon Personalize não usará o campo ao treinar um modelo.

Palavras-chave reservadas

As palavras-chave reservadas são campos opcionais e não de metadados. Esses campos são considerados reservados porque você precisa definir os campos como seu tipo de dados necessário ao usá-los, e as palavras-chave não podem ser usadas como valores nos seus dados. Os campos de string de caracteres categóricos reservados devem ter categorical definido como true, enquanto os campos de string de caracteres reservados não podem ser categóricos. A seguir, veja as palavras-chave reservadas:

  • EVENT_TYPE: em conjuntos de dados de interações com itens com um ou mais tipos de evento, como clicar e baixar, use um campo EVENT_TYPE. É necessário definir um campo EVENT_TYPE como um string e ele não pode ser definido como categórico.

  • EVENT_VALUE: em conjuntos de dados de interações com itens que incluam dados de valor para eventos, como a porcentagem de um vídeo assistida por um usuário, utilize um campo EVENT_VALUE com o tipo float e, opcionalmente, null.

  • CREATION_TIMESTAMP: em conjuntos de dados de itens ou ações com um carimbo de data de criação de cada item, use um campo CREATION_TIMESTAMP com um tipo long. O Amazon Personalize usa dados CREATION_TIMESTAMP para calcular a idade de um item e ajustar as recomendações de acordo. Consulte Dados de carimbo de data e hora de criação.

  • IMPRESSION: em conjuntos de dados de interações com itens com dados de impressões explícitos, use um campo IMPRESSION com o tipo String e, opcionalmente, o tipo null. Impressões são listas de itens que estavam visíveis para um usuário durante a interação (por exemplo, clicar ou assistir) com determinado item. Para obter mais informações, consulte Dados de impressões.

  • RECOMMENDATION_ID: em conjuntos de dados de interações com itens que usem recomendações anteriores como dados de impressões implícitos, use, opcionalmente, um campo RECOMMENDATION_ID com o tipo String e, opcionalmente, o tipo null.

    Você não precisa adicionar um campo RECOMMENDATION_ID para que o Amazon Personalize use impressões implícitas ao gerar recomendações. Você pode passar um recommendationId em uma operação PutEvents sem esse campo. Para obter mais informações, consulte Dados de impressões.

  • VALUE: em conjuntos de dados de ações, se houver dados de valor para algumas ou todas as ações, adicione um campo VALUE ao esquema. Para o tipo, use long e, opcionalmente, digite null. Para obter mais informações sobre ações e o respectivo valor, consulte Value data.

  • ACTION_EXPIRATION_TIMESTAMP: em conjuntos de dados de ações, se houver um carimbo de data e hora de expiração para algumas ou todas as ações, adicione um campo ACTION_EXPIRATION_TIMESTAMP ao esquema. Para o tipo, use long e, opcionalmente, digite null. Para obter mais informações sobre carimbos de data e hora, consulte Dados de carimbo de data e hora de expiração da ação.

  • REPEAT_FREQUENCY: em conjuntos de dados de ações, se houver dados de frequência de repetição para algumas ou todas as ações, adicione um campo REPEAT_FREQUENCY ao esquema. Para o tipo, use long e, opcionalmente, digite null. Para obter mais informações sobre dados de frequência de repetição, consulte Dados de frequência de repetição.