Como ela funciona - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como ela funciona

Para fazer recomendações, o Amazon Personalize usa um modelo de machine learning que é treinado com seus dados. Os dados usados para treinar o modelo são armazenados em conjuntos de dados relacionados a um grupo de conjuntos de dados. Cada modelo é treinado usando uma receita que contém um algoritmo para um caso de uso específico. No Amazon Personalize, um modelo treinado é conhecido como uma versão da solução. Uma versão da solução é implantada para ser usada em uma campanha. Os usuários de seus aplicativos podem receber recomendações por meio da campanha. Por exemplo, uma campanha pode mostrar as recomendações de filmes em um site ou aplicativo em que o título mostrado é baseado em hábitos de visualização que fazem parte do conjunto de dados.

Um conjunto de dados pode crescer ao longo do tempo e seus modelos podem ser treinados novamente com os dados novos. Os dados podem ser provenientes de novos metadados e do consumo de dados de eventos de usuários em tempo real. No exemplo anterior de recomendações de filmes, você poderia adicionar novos filmes à medida que eles que forem lançados, bem como adicionar um filme escolhido pelo usuário conectado.

O Amazon Personalize tem um console da AWS que você pode usar para criar, gerenciar e implantar versões das solução. Em alternativa, pode utilizar o AWS Command Line Interface (AWS CLI) ou um dos Amazon Personalize SDKs.

O Amazon Personalize consiste em três componentes relacionados:

  • Amazon Personalize – use essa opção para criar, gerenciar e implantar versões da solução.

  • Amazon Personalize Eventos – Use isto para gravar eventos para adicionar aos seus dados de formação. Para obter mais informações, consulte Registro de eventos.

  • Amazon Personalize Runtime (Tempo de execução do &CONCIERGElong;) – use essa opção para obter recomendações de uma campanha (versão da solução implantada). Para obter mais informações, consulte Como obter recomendações.

Fluxo de trabalho Amazon Personalize

O fluxo de trabalho para treinamento, implantação e obtenção de recomendações de uma campanha é:

  1. Criar conjuntos de dados relacionados e um grupo de conjuntos de dados.

  2. Obter dados de treinamento.

    • Importar os dados históricos para o grupo de conjuntos de dados.

    • Registrar os eventos do usuário para o grupo de conjuntos.

  3. Criar uma versão da solução (modelo treinado) usando uma receita.

  4. Avaliar a versão da solução usando métricas.

  5. Criar uma campanha (implantar a versão da solução).

  6. Forneça as recomendações aos usuários.

As seções a seguir fornecem uma breve visão geral do fluxo de trabalho acima. Cada seção inclui um link para o tópico principal que descreve a etapa em profundidade e fornece um exemplo de Python.

Os guias Conceitos básicos fornecem procedimentos passo a passo usando o console do Amazon Personalize, a AWS CLI e um bloco de notas Jupyter (iPython).

Conjuntos de dados e grupos de conjuntos de dados

O Amazon Personalize requer dados armazenados em conjuntos de dados do Amazon Personalize para treinar um modelo.

Existem duas maneiras de fornecer os dados de treinamento. Você pode importar dados históricos de um bucket do Amazon S3 e registrar dados de eventos à medida que forem criados.

Um grupo de conjuntos de dados contém conjuntos de dados relacionados. Pode criar três tipos de conjuntos de dados históricos: Utilizadores, Itens e Interações. Um grupo de conjuntos de dados pode conter apenas um de cada tipo de conjunto de dados e, no mínimo, deve conter um conjunto de dados de Interações.

É possível criar grupos de conjuntos de dados para atender a diferentes finalidades. Por exemplo, você pode ter um aplicativo que faça recomendações de compra de sapatos e outro que faça recomendações sobre lugares para visitar na Europa. No Amazon Personalize, cada aplicativo poderia ter seu próprio grupo de conjuntos de dados.

Os dados históricos devem ser fornecidos em um arquivo CSV. Cada tipo de conjunto de dados tem um esquema exclusivo que especifica o conteúdo do arquivo CSV.

Os requisitos mínimos de dados para treinar um modelo são os seguintes:

  • 1000 registos de dados de interação combinados (após filtragem por eventType e eventValueThreshold, se fornecido).

  • 25 utilizadores únicos com pelo menos 2 interações cada.

nota

O uso de dados existentes permite iniciar imediatamente o treinamento de um modelo. Se você conta apenas com dados registrados à medida que eles são criados e não há dados históricos, pode demorar um pouco antes de o treinamento começar.

Para obter mais informações, consulte Preparar e importar dados.

Eventos do usuário

Amazon Personalize podem consumir em tempo real eventos do utilizador para ser usado para formação de modelo, seja isoladamente ou combinado com dados históricos.

Para obter mais informações, consulte Registro de eventos.

Receitas e soluções

Assim que houver dados suficientes disponíveis nos conjuntos de dados de interações (eventos históricos e em tempo real), será possível usar os dados para treinar um modelo. Um modelo treinado é conhecido como uma versão da solução. O modelo é treinado usando uma receita. As receitas disponíveis no Amazon Personalize são feitas de um algoritmo e das etapas de processamento de dados que otimizam uma solução para um tipo de recomendação com base em seus dados de entrada.

O Amazon Personalize oferece suporte a várias receitas predefinidas. O Amazon Personalize pode escolher automaticamente a receita mais apropriada com base em sua análise dos dados de treinamento. Como alternativa, você pode escolher qual receita será usada para treinar o modelo. Cada receita tem seu próprio caso de uso e você deve escolher a receita que melhor atende às suas necessidades.

Cada vez que você treina um modelo, é atribuída uma nova versão da solução. Use o ARN da versão da solução para identificar qual versão da solução você deseja usar para sua campanha.

Para obter mais informações, consulte Como criar uma solução.

Metrics

Depois de criar sua versão da solução, avalie as métricas criadas durante o treinamento. As métricas indicam o desempenho da versão da solução. O console exibe as métricas e permite que você crie uma nova versão da solução se precisar. Como alternativa, você pode chamar a API GetSolutionMetrics. Normalmente, você treina o modelo com várias receitas e usa a receita resultante das métricas que mostram o melhor desempenho. Depois de criar uma versão da solução com base na receita que você escolheu, a versão da solução estará pronta para implantação como uma campanha.

Para obter mais informações, consulte Etapa 4: Avaliar uma versão da solução.

Campaigns

Uma versão da solução implantada é conhecida como campanha. Uma campanha permite ao Amazon Personalize fazer recomendações para seus usuários. Para implantar uma versão da solução, crie uma campanha no console ou chamando a API CreateCampaign. Você pode escolher qual versão da solução usar.

Para obter mais informações, consulte Como criar uma campanha.

Recommendations

Depois de criar uma campanha, pode obter recomendações em tempo real ou como parte de um fluxo de trabalho de lote com dados puramente históricos. Para obter mais informações, consulte Como obter recomendações.

Recomendações em tempo real

Obtenha recomendações em tempo real em situações em que queira atualizar recomendações à medida que os clientes utilizam a sua aplicação. Por exemplo, diga que fornece recomendações de filmes a utilizadores com sessão iniciada na sua aplicação e que pretende que as recomendações sejam atualizadas à medida que escolhem filmes diferentes.

Consegue obter dois tipos diferentes de recomendações em tempo real:

  • Para personalização do utilizador e receitas de itens relacionados, utilize o GetRecommendations API para obter uma lista de itens recomendados. Por exemplo, seu site pode recomendar filmes para os usuários conectados a um site.

  • Para receitas de classificação personalizadas, use o GetPersonalizedRanking API a ter Amazon Personalize reclassificar uma lista de itens recomendados com base numa consulta especificada.

Para obter mais informações, consulte Obter recomendações em tempo real.

Recomendações de lote

Obtenha recomendações de lotes em situações em que tenha grandes conjuntos de dados que não exijam atualizações em tempo real. Por exemplo, é possível criar um trabalho de inferência em lote a fim de obter recomendações de produtos para todos os usuários em uma lista de e-mails ou a fim de obter semelhanças de item para item (SIMS) em um inventário.

Para obter mais informações, consulte Obter recomendações em lote.