Conjunto de dados de interações com itens - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Conjunto de dados de interações com itens

Uma interação de item é um evento de interação entre um usuário e um item em seu catálogo. Por exemplo, um usuário assistindo a um filme, visualizando um anúncio ou comprando um par de sapatos. Você deve importar dados sobre interações entre usuários e itens para um conjunto de dados de interações com itens. Você pode gravar vários tipos de eventos, como clicar, assistir ou curtir.

Por exemplo, se um usuário clicar em um item específico e depois curtir o item, você pode fazer com que o Amazon Personalize use esses eventos como dados de treinamento. Para cada evento, você registraria o ID do usuário, o ID do item, o carimbo de data/hora (no formato de horário Unix epoch) e o tipo de evento (clicar e curtir). Depois, você deve adicionar os dois eventos de interação a um conjunto de dados de interações com itens.

Em todos os casos de uso (grupos de conjuntos de dados de domínio) e fórmulas (recursos personalizados), os dados de interações com itens devem ter o seguinte:

  • No mínimo, mil registros de interações com itens de usuários que interagem com itens do catálogo. Essas interações podem ser de importações em massa, eventos transmitidos ou ambas as coisas.

  • No mínimo, 25 IDs de usuários exclusivos com, pelo menos, duas interações com itens para cada um.

Para obter recomendações de qualidade, o ideal é que você tenha, no mínimo, cinquenta mil interações com itens de, pelo menos, mil usuários com duas ou mais interações com itens cada.

Para criar um recomendador ou uma solução personalizada, é necessário, no mínimo, criar um conjunto de dados de interações com itens. Esta seção fornece informações sobre os tipos de dados de interações com itens que você pode importar para o Amazon Personalize.

Tipo de evento e dados de valor do evento

Um conjunto de dados de interações de itens pode armazenar dados de tipo e valor de evento para cada interação. Somente recursos personalizados usam dados de valor do evento.

Dados de tipos de eventos

O Amazon Personalize usa dados do tipo de evento, como dados de clique ou compra, para identificar a intenção e o interesse do usuário. Se você criar recomendadores de domínio, todos os casos de uso exigirão dados do tipo de evento. Alguns casos de uso exigem tipos de eventos específicos. Você pode usar tipos de eventos adicionais. Para obter mais informações, consulte Escolher um caso de uso.

Se você criar recursos personalizados, poderá escolher os eventos usados para treinamento por tipo de evento. Se seu conjunto de dados tiver vários tipos de eventos em uma coluna EVENT_TYPE e você não fornecer um tipo de evento ao configurar uma solução personalizada, o Amazon Personalize usa todos os dados de interações de itens para treinamento com o mesmo peso, independentemente do tipo. Para ter mais informações, consulte Selecionar os dados de interações com itens utilizados para treinamento.

Tipos de eventos positivos e negativos

O Amazon Personalize presume que qualquer interação é positiva. Interações com um tipo de evento negativo, como não curtir, não necessariamente impedirão que o item apareça nas recomendações futuras do usuário.

Veja a seguir formas de fazer com que eventos negativos e o desinteresse dos usuários influenciem as recomendações:

Dados de valor do evento (recursos personalizados)

Os dados do valor do evento podem ser a porcentagem de um filme que um usuário assistiu ou uma classificação de 10. Se você criar soluções personalizadas e importar dados de valor do evento junto com os dados do tipo de evento, poderá escolher os registros usados para treinamento com base no tipo e no valor. Com os recomendadores de domínio, o Amazon Personalize não usa dados de valor de eventos e você não pode filtrar eventos antes do treinamento.

Para escolher registros com base no tipo e no valor, registre um tipo de evento e um valor de evento para cada evento. O valor escolhido para cada evento depende dos dados que você deseja excluir e dos tipos de eventos que você está gravando. Por exemplo, você pode corresponder à atividade do usuário, como a porcentagem de vídeos que o usuário assistiu para os tipos de eventos assistir.

Ao configurar uma solução, você define um valor específico como limite para excluir registros do treinamento. Por exemplo, se seus dados de EVENT_VALUE para eventos com um EVENT_TYPE DE watch forem a porcentagem do vídeo que um usuário assistiu e você definir o limite do valor do evento como 0,5 e o tipo de evento como watch, o Amazon Personalize treinará o modelo usando somente eventos de interação de watch com EVENT_VALUE maior ou igual a 0,5.

Para mais informações, consulte Selecionar os dados de interações com itens utilizados para treinamento.

Metadados contextuais

Com determinados casos de uso de fórmulas e recomendadores, o Amazon Personalize pode usar metadados contextuais ao identificar padrões subjacentes que revelam os itens mais relevantes para seus usuários. Metadados contextuais são dados de interações que você coleta no ambiente do usuário no momento de um evento, como sua localização ou tipo de dispositivo.

A inclusão de metadados contextuais permite que você forneça uma experiência mais personalizada para os usuários existentes. Por exemplo, se os clientes comprarem de forma diferente ao acessar seu catálogo usando um telefone e não um computador, inclua metadados contextuais sobre o dispositivo do usuário. As recomendações serão mais relevantes com base em como eles estão navegando.

Além disso, os metadados contextuais ajudam a diminuir a fase de inicialização a frio para usuários novos ou não identificados. A fase de inicialização a frio refere-se ao período em que seu mecanismo de recomendação fornece recomendações menos relevantes devido à falta de informações históricas sobre esse usuário.

Para grupos de conjuntos de dados de domínio, os seguintes casos de uso de recomendador podem usar metadados contextuais:

Para recursos personalizados, as fórmulas que usam metadados contextuais incluem o seguinte:

Para obter mais informações sobre informações contextuais, consulte a seguinte postagem no blog do AWS Machine Learning: Aumentando a relevância de suas recomendações do Amazon Personalize utilizando informações contextuais.

Dados de impressões

Se você criar um grupo de conjuntos de dados para o domínio VIDEO_ON_DEMAND ou ECOMMERCE ou usar a fórmula User-Personalization, o Amazon Personalize poderá modelar dados de impressões transferidos por upload para um conjunto de dados de interações com itens. Impressões são listas de itens que estavam visíveis para um usuário durante a interação (por exemplo, clicar ou assistir) com determinado item.

O Amazon Personalize usa dados de impressões para determinar quais itens incluir na exploração. Com a exploração, as recomendações incluem alguns itens ou ações que normalmente teriam menor probabilidade de ser recomendados para o usuário, como novos itens ou ações, itens ou ações com poucas interações ou itens ou ações menos relevantes com base no comportamento anterior do usuário. Quanto mais frequentemente um item aparece nos dados de impressões, menor a probabilidade de o Amazon Personalize incluir o item na exploração. Os valores de impressão podem ter no máximo 1.000 caracteres (incluindo o caractere da barra vertical).

Para obter mais informações sobre exploração, consulte Exploration (Exploração). O Amazon Personalize pode modelar dois tipos de impressões: Impressões implícitas e Impressões explícitas.

Impressões implícitas

As impressões implícitas são as recomendações, recuperadas do Amazon Personalize, que você mostra ao usuário. Você pode integrá-las ao seu fluxo de trabalho de recomendação incluindo o RecommendationId (retornado pelas operações GetRecommendations e GetPersonalizedRanking) como entrada para futuras solicitações PutEvents. O Amazon Personalize obtém as impressões implícitas com base nos seus dados de recomendação.

Por exemplo, você pode ter um aplicativo que faça recomendações de streaming de vídeo. Seu fluxo de trabalho de recomendação usando impressões implícitas pode ser o seguinte:

  1. Você solicita recomendações de vídeo para um de seus usuários usando a operação da API GetRecommendations do Amazon Personalize.

  2. O Amazon Personalize gera recomendações para o usuário usando seu modelo (versão da solução) e as retorna com um recommendationId na resposta da API.

  3. Você mostra as recomendações de vídeo para o usuário em seu aplicativo.

  4. Quando seu usuário interage com (por exemplo, clica em) um vídeo, grave a escolha em uma chamada para a API do PutEvents e inclua o recommendationId como parâmetro. Para obter um exemplo de código, consulte Como registrar dados de impressões.

  5. O Amazon Personalize usa o recommendationId para derivar os dados de impressão das recomendações de vídeo anteriores e, em seguida, usa os dados de impressão para orientar a exploração, onde as recomendações futuras incluem novos vídeos com menos dados de interações ou relevância.

    Para obter mais informações sobre como registrar eventos com dados de impressão implícita, consulte Como registrar dados de impressões.

Impressões explícitas

Impressões explícitas são impressões que você grava e envia manualmente para o Amazon Personalize. Use impressões explícitas para manipular os resultados do Amazon Personalize. A ordem dos itens não é relevante.

Por exemplo, você pode ter um aplicativo de compras que faça recomendações de calçados. Se recomendar apenas calçados que estão atualmente em estoque, você pode especificar esses itens usando impressões explícitas. Seu fluxo de trabalho de recomendação usando impressões explícitas pode ser o seguinte:

  1. Você solicita recomendações para um de seus usuários usando a API GetRecommendations do Amazon Personalize.

  2. O Amazon Personalize gera recomendações para o usuário usando seu modelo (versão da solução) e as retorna na resposta da API.

  3. Você mostra ao usuário somente os calçados recomendados que estão em estoque.

  4. Para importação incremental de dados em tempo real, quando seu usuário interage com (por exemplo, clica em) um par de sapatos, você grava a escolha em uma chamada para a API PutEvents e lista os itens recomendados que estão em estoque no parâmetro impression. Para obter um exemplo de código, consulte Como registrar dados de impressões.

    Para importar impressões em dados históricos de interações com itens, é possível listar impressões explícitas no arquivo csv e separar cada item com um caractere “|”. O caractere de barra vertical conta para o limite de 1.000 caracteres. Para ver um exemplo, consulte Como formatar impressões explícitas.

  5. O Amazon Personalize usa os dados de impressões para orientar a exploração, considerando que as recomendações futuras incluem novos sapatos com menos dados de interações ou relevância.