Fórmula de SIMS - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Fórmula de SIMS

nota

Todas as fórmulas RELATED_ITEMS usam dados de interações. Escolha SIMS se quiser configurar mais hiperparâmetros para o modelo. Escolha Fórmula de itens semelhantes se você tem metadados de itens e quer que o Amazon Personalize use esses metadados para encontrar itens semelhantes.

A receita de tem-to-item semelhanças I (SIMS) usa filtragem colaborativa para recomendar itens que são mais parecidos com um item que você especifica ao receber recomendações. A SIMS usa o conjunto de dados de interações com itens, não metadados de itens, como cor ou preço, para determinar a similaridade. O SIMS identifica a ocorrência simultânea do item nos históricos do usuário em seu conjunto de dados de interações para recomendar itens semelhantes. Por exemplo, com SIMS, o Amazon Personalize poderia recomendar itens de cafeteria que os clientes frequentemente compravam juntos ou filmes que diversos usuários também assistiam.

Ao obter recomendações de itens semelhantes, você pode filtrar os itens com base em um atributo do item especificado na sua solicitação. Para isso, adicione um elemento CurrentItem.attribute ao seu filtro. Para ver um exemplo, consulte item data filter examples.

Para usar a SIMS, é necessário criar um conjunto de dados de interações com itens com, pelo menos, mil interações históricas e com eventos exclusivas (combinadas). A SIMS não usa dados em um conjunto de dados de itens ou de usuários ao gerar recomendações. Você ainda pode filtrar recomendações com base nos dados desses conjuntos de dados. Para ter mais informações, consulte Como filtrar recomendações e segmentos de usuários.

Se não houver dados de comportamento do usuário suficientes para um item ou se o ID do item fornecido não for encontrado, a SIMS recomenda itens populares. Depois de criar uma versão da solução, mantenha a versão e os dados da solução atualizados. Com o SIMS, você deve criar manualmente uma nova versão da solução (retreinar o modelo) para que o Amazon Personalize considere novos itens para recomendações e atualize o modelo com o comportamento mais recente do seu usuário. Em seguida, será necessário atualizar qualquer campanha usando a versão da solução. Para ter mais informações, consulte Manter a relevância da recomendação.

A fórmula de SIMS tem as seguintes propriedades:

  • Nome: aws-sims

  • Fórmula nome do recurso da Amazon (ARN)arn:aws:personalize:::recipe/aws-sims

  • ARN do algoritmoarn:aws:personalize:::algorithm/aws-sims

  • ARN de transformação de atributosarn:aws:personalize:::feature-transformation/sims

  • Tipo de fórmulaRELATED_ITEMS

A tabela a seguir descreve os hiperparâmetros da fórmula de SIMS. Um hiperparâmetro é um parâmetro de algoritmo que pode ser ajustado para melhorar o desempenho do modelo. Os hiperparâmetros do algoritmo controlam o desempenho do modelo. Os hiperparâmetros de caracterização controlam como filtrar os dados a serem usados no treinamento. O processo de escolher o melhor valor para um hiperparâmetro é chamado de otimização de hiperparâmetros (HPO). Para ter mais informações, consulte Hiperparâmetros e HPO.

A tabela também fornece as seguintes informações para cada hiperparâmetro:

  • Intervalo: [limite inferior, limite superior]

  • Tipo de valor: inteiro, contínuo (float), categórico (booliano, lista, string)

  • HPO tunable (HPO ajustável): o parâmetro pode participar da otimização do hiperparâmetro (HPO)?

Nome Descrição
Hiperparâmetros de algoritmo
popularity_discount_factor

Configure como a popularidade influencia as recomendações. Especifique um valor mais próximo de zero para incluir itens mais populares. Especifique um valor mais próximo de um para dar menos ênfase à popularidade.

Valor padrão: 0.5

Intervalo: [0,0, 1,0]

Tipo de valor: flutuante

Ajustável de HPO: sim

min_cointeraction_count

O número mínimo de cointerações de que você precisa para calcular a semelhança entre um par de itens. Por exemplo, um valor de 3 significa que você precisa de três ou mais usuários que interagiram com os dois itens para que o algoritmo calcule a semelhança entre eles.

Valor padrão: 3

Intervalo: [0, 10]

Tipo de valor: inteiro

Ajustável de HPO: sim

Hiperparâmetros de caracterização
min_user_history_length_percentile

O percentil mínimo dos comprimentos dos históricos de usuários para incluir no treinamento do modelo. O comprimento do histórico é a quantidade total de dados disponíveis de um usuário. Use min_user_history_length_percentile para excluir uma porcentagem de usuários com históricos breves. Os usuários com um histórico breve geralmente mostram padrões baseados na popularidade dos itens em vez das necessidades ou dos desejos pessoais do usuário. Removê-los pode treinar modelos com mais foco nos padrões subjacentes nos dados. Escolha um valor apropriado depois de revisar os comprimentos de histórico dos usuários usando um histograma ou uma ferramenta semelhante. Recomendamos definir um valor que retenha a maioria dos usuários, mas remova os casos de borda.

Valor padrão: 0.005

Intervalo: [0,0, 1,0]

Tipo de valor: flutuante

HPO ajustável: não

max_user_history_length_percentile

O percentil máximo dos comprimentos dos históricos de usuários a ser incluído no treinamento do modelo. O comprimento do histórico é a quantidade total de dados disponíveis de um usuário. Use max_user_history_length_percentile para excluir uma porcentagem de usuários com históricos longos. Usuários com um histórico longo tendem a conter ruído. Por exemplo, um robô pode ter uma longa lista de interações automatizadas. A remoção desses usuários limita o ruído no treinamento. Escolha um valor apropriado depois de revisar os comprimentos de histórico dos usuários usando um histograma ou uma ferramenta semelhante. Recomendamos definir um valor que retenha a maioria dos usuários, mas remova os casos de borda.

Por exemplo, min_hist_length_percentile = 0.05 e max_hist_length_percentile = 0.95 incluem todos os usuários, exceto aqueles com comprimentos de histórico nos 5% inferiores ou superiores.

Valor padrão: 0,995

Intervalo: [0,0, 1,0]

Tipo de valor: flutuante

HPO ajustável: não

min_item_interaction_count_percentile

O percentil mínimo de contagens de interações com itens para inclusão no treinamento do modelo. Use min_item_interaction_count_percentile para excluir uma porcentagem de itens com histórico breve de interações. Itens com um histórico breve geralmente são itens novos. A remoção deles pode produzir um treinamento de modelos com mais foco em itens com um histórico conhecido. Escolha um valor apropriado depois de revisar os comprimentos de histórico dos usuários usando um histograma ou uma ferramenta semelhante. Recomendamos definir um valor que retenha a maioria dos itens, mas remova os casos de borda.

Valor padrão: 0,01

Intervalo: [0,0, 1,0]

Tipo de valor: flutuante

HPO ajustável: não

max_item_interaction_count_percentile

O percentil máximo de contagens de interações com itens para incluir no treinamento do modelo. Use max_item_interaction_count_percentile para excluir uma porcentagem de itens com histórico longo de interações. Itens com um histórico longo tendem a ser mais antigos e podem estar desatualizados. Por exemplo, o lançamento de um filme que está fora de circulação. Com a remoção desses itens, é possível se concentrar em itens mais relevantes. Escolha um valor apropriado depois de revisar os comprimentos de histórico dos usuários usando um histograma ou uma ferramenta semelhante. Recomendamos definir um valor que retenha a maioria dos itens, mas remova os casos de borda.

Por exemplo, min_item_interaction_count_percentile = 0.05 e max_item_interaction_count_percentile = 0.95 incluem todos os itens, exceto aqueles com uma contagem de interações nos 5% inferiores ou superiores.

Valor padrão: 0.9

Intervalo: [0,0, 1,0]

Tipo de valor: flutuante

HPO ajustável: não

Exemplo de bloco de notas de SIMS

Para ver um exemplo de bloco de anotações Jupyter que mostre como usar a fórmula SIMS, consulte Finding similar items + HPO.