As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Conjuntos de dados personalizados e esquemas
Ao criar um grupo de conjuntos de dados personalizados, você cria seus próprios esquemas do zero. Os conjuntos de dados e esquemas de grupos de dados personalizados têm menos campos obrigatórios e mais flexibilidade. Os tópicos a seguir explicam os requisitos de esquema e dados para os conjuntos de dados de um grupo de conjuntos de dados personalizados. Cada seção do conjunto de dados lista os dados necessários para o tipo de conjunto de dados e fornece um exemplo de esquema em JSON.
Para obter informações sobre os tipos de dados que você pode importar para o Amazon Personalize, consulte Tipos de dados que o Amazon Personalize pode usar. Para obter informações sobre os requisitos gerais de esquema do Amazon Personalize, como requisitos de formatação e tipos de dados de campo disponíveis, consulte Criar arquivos JSON de esquema para esquemas do Amazon Personalize. Esses requisitos aplicam-se a todos os esquemas do Amazon Personalize.
Tópicos
- Requisitos de conjuntos de dados personalizados e esquemas
- Requisitos do esquema de conjunto de dados de interações com itens (personalizado)
- Requisitos do esquema de conjunto de dados de usuários (personalizado)
- Requisitos do esquema de conjunto de dados de itens (personalizado)
- Requisitos do esquema de conjunto de dados de ações (personalizado)
- Requisitos do esquema de conjunto de dados de interações com ações (personalizado)
Requisitos de conjuntos de dados personalizados e esquemas
Quando você cria um conjunto de dados para um grupo de conjuntos de dados personalizados, cada tipo de conjunto de dados tem os seguintes campos obrigatórios e palavras-chave reservadas com os tipos de dados obrigatórios.
Tipo de conjunto de dados | Campos obrigatórios | Palavras-chave reservadas |
---|---|---|
Interações com itens (exemplo de esquema) |
USER_ID ( ITEM_ID ( TIMESTAMP ( |
EVENT_TYPE ( EVENT_VALUE ( IMPRESSION ( RECOMMENDATION_ID ( EVENT_ATTRIBUTION_SOURCE ( |
Usuários (exemplo de esquema) |
USER_ID ( 1 campo de metadados ( |
|
Itens (exemplo de esquema) |
ITEM_ID ( 1 campo de metadados (campo |
CREATION_TIMESTAMP ( |
Ações (exemplo de esquema) |
ACTION_ID ( 1 campo de metadados ( |
CREATION_TIMESTAMP ( VALUE ( TYPE ( EXPIRATION_TIMESTAMP ( REPEAT_FREQUENCY ( |
Interações com ações (exemplo de esquema) |
USER_ID ( ACTION_ID ( EVENT_TYPE ( TIMESTAMP ( |
IMPRESSION ( RECOMMENDATION_ID ( |
Campos de metadados
Os metadados incluem campos com ou sem string de caracteres que não são obrigatórios ou não usam uma palavra-chave reservada. Os esquemas de metadados têm as seguintes restrições:
-
Os esquemas de Usuários, Itens e Ações exigem pelo menos um campo de metadados.
-
É possível adicionar, no máximo, 25 campos de metadados para um esquema de usuários e 100 campos de metadados para um esquema de ações.
-
Se você adicionar seu próprio campo de metadados do tipo
string
, ele deverá incluir o atributocategorical
ou o atributotextual
(somente os esquemas de itens oferecem suporte a campos com o atributo textual). Caso contrário, o Amazon Personalize não usará o campo ao treinar um modelo.
Palavras-chave reservadas
As palavras-chave reservadas são campos opcionais e não de metadados. Esses campos são considerados reservados porque você precisa definir os campos como seu tipo de dados necessário ao usá-los, e as palavras-chave não podem ser usadas como valores nos seus dados. Os campos de string de caracteres categóricos reservados devem ter categorical
definido como true
, enquanto os campos de string de caracteres reservados não podem ser categóricos. A seguir, veja as palavras-chave reservadas:
-
EVENT_TYPE: em conjuntos de dados de interações com itens com um ou mais tipos de evento, como clicar e baixar, use um campo
EVENT_TYPE
. É necessário definir um campo EVENT_TYPE como umstring
e ele não pode ser definido como categórico. -
EVENT_VALUE: em conjuntos de dados de interações com itens que incluam dados de valor para eventos, como a porcentagem de um vídeo assistida por um usuário, utilize um campo
EVENT_VALUE
com o tipofloat
e, opcionalmente,null
. -
CREATION_TIMESTAMP: em conjuntos de dados de itens ou ações com um carimbo de data de criação de cada item, use um campo
CREATION_TIMESTAMP
com um tipolong
. O Amazon Personalize usa dadosCREATION_TIMESTAMP
para calcular a idade de um item e ajustar as recomendações de acordo. Consulte Dados de carimbo de data e hora de criação. -
IMPRESSION: em conjuntos de dados de interações com itens com dados de impressões explícitos, use um campo
IMPRESSION
com o tipoString
e, opcionalmente, o tiponull
. Impressões são listas de itens que estavam visíveis para um usuário durante a interação (por exemplo, clicar ou assistir) com determinado item. Para obter mais informações, consulte Dados de impressões. -
RECOMMENDATION_ID: em conjuntos de dados de interações com itens que usem recomendações anteriores como dados de impressões implícitos, use, opcionalmente, um campo
RECOMMENDATION_ID
com o tipoString
e, opcionalmente, o tiponull
.Você não precisa adicionar um campo
RECOMMENDATION_ID
para que o Amazon Personalize use impressões implícitas ao gerar recomendações. Você pode passar umrecommendationId
em uma operação PutEvents sem esse campo. Para obter mais informações, consulte Dados de impressões. -
VALUE: em conjuntos de dados de ações, se houver dados de valor para algumas ou todas as ações, adicione um campo
VALUE
ao esquema. Para o tipo, uselong
e, opcionalmente, digitenull
. Para obter mais informações sobre ações e o respectivo valor, consulte Value data. -
ACTION_EXPIRATION_TIMESTAMP: em conjuntos de dados de ações, se houver um carimbo de data e hora de expiração para algumas ou todas as ações, adicione um campo
ACTION_EXPIRATION_TIMESTAMP
ao esquema. Para o tipo, uselong
e, opcionalmente, digitenull
. Para obter mais informações sobre carimbos de data e hora, consulte Dados de carimbo de data e hora de expiração da ação. -
REPEAT_FREQUENCY: em conjuntos de dados de ações, se houver dados de frequência de repetição para algumas ou todas as ações, adicione um campo
REPEAT_FREQUENCY
ao esquema. Para o tipo, uselong
e, opcionalmente, digitenull
. Para obter mais informações sobre dados de frequência de repetição, consulte Dados de frequência de repetição.