Trabalhando com AWS Clean Rooms ML - AWS Clean Rooms

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Trabalhando com AWS Clean Rooms ML

Um modelo de semelhanças é um modelo dos dados de um provedor de dados de treinamento que permite que um provedor de dados de seed crie um segmento de semelhanças dos dados do provedor de dados de treinamento que mais se assemelhe aos dados de seed. Para criar um modelo de semelhanças que possa ser usado em uma colaboração, você deve importar seus dados de treinamento, criar um modelo de semelhanças, configurar esse modelo de semelhanças e, depois, associá-lo a uma colaboração.

Depois que o provedor de dados de treinamento terminar de criar o modelo de ML, o provedor de dados de seed poderá criar e exportar o segmento de seed.

Trabalhando com modelos semelhantes (provedor de dados de treinamento)

Importar dados de treinamento

Antes de criar um modelo semelhante, você deve especificar a AWS Glue tabela que contém os dados de treinamento. O Clean Rooms ML não armazena uma cópia desses dados, apenas metadados que permitem que ele acesse os dados.

Para importar dados de treinamento em AWS Clean Rooms
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console com seu Conta da AWS (se ainda não tiver feito isso).

  2. No painel de navegação à esquerda, selecione Modelagem de ML.

  3. Na guia Conjuntos de dados de treinamento, escolha Criar conjunto de dados de treinamento.

  4. Insira um Nome e uma Descrição opcional.

  5. Em Fonte de dados, escolha sua AWS Glue tabela:

    1. Escolha o Banco de dados que você deseja configurar na lista suspensa.

    2. Escolha a fonte de dados de treinamento selecionando o banco de dados e a tabela que você deseja configurar nas listas suspensas.

    nota

    Para verificar se essa é a tabela correta, faça um dos seguintes:

    • Escolha Exibir em AWS Glue.

    • Ative Exibir esquema para ver o esquema.

  6. Para obter detalhes do treinamento, escolha a coluna Identificador do usuário, a coluna Identificador do item e a coluna Timestamp nos seus dados. Os dados de treinamento devem conter essas três colunas. Você também pode selecionar qualquer outra coluna que queira incluir nos dados de treinamento.

    Os dados na coluna Timestamp devem estar no formato de tempo de época do Unix em segundos.

  7. No Acesso ao serviço, você deve especificar uma função de serviço que possa acessar seus dados e fornecer uma chave KMS se seus dados estiverem criptografados. Escolha Criar e usar uma nova função de serviço e o Clean Rooms ML criará automaticamente uma função de serviço e adicionará a política de permissões necessária. Escolha Usar uma função de serviço existente e insira-a no campo Nome da função de serviço se você tiver uma função de serviço específica que deseja usar.

    Se seus dados estiverem criptografados, insira sua chave KMS no AWS KMS keycampo ou clique em Criar uma AWS KMS key para gerar uma nova chave KMS.

  8. Se você quiser habilitar Tags para o conjunto de dados de treinamento, escolha Adicionar nova tag e insira o par de Chave e Valor.

  9. Escolha Criar conjunto de dados de treinamento.

Para ver a ação de API correspondente, consulte CreateTrainingConjunto de dados.

Criar um modelo de semelhanças

Depois de criar um conjunto de dados de treinamento, estará tudo pronto para criar um modelo de semelhanças. É possível criar vários modelos de semelhanças com base em um único conjunto de dados de treinamento.

Você deve criar um banco de dados padrão em sua função AWS Glue Data Catalog ou incluir a glue:createDatabase permissão na função fornecida.

Para criar um modelo semelhante em AWS Clean Rooms
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console com seu Conta da AWS (se ainda não tiver feito isso).

  2. No painel de navegação à esquerda, selecione Modelagem de ML.

  3. Na guia Modelos de semelhanças, escolha Criar modelo de semelhanças.

  4. Para Criar modelo de semelhanças, em Detalhes do modelo de semelhanças:

    1. Insira um Nome e uma Descrição opcional.

    2. Escolha o Conjunto de dados de treinamento que você deseja modelar na lista suspensa.

    3. Insira uma Janela de treinamento opcional.

  5. Se você quiser habilitar as configurações de criptografia personalizadas para o modelo de semelhanças, escolha Personalizar configurações de criptografia e insira a chave do KMS.

  6. Se você quiser habilitar Tags para o modelo de semelhanças, escolha Adicionar nova tag e insira o par de Chave e Valor.

  7. Escolha Criar modelo de semelhanças.

Para a ação de API correspondente, consulte CreateAudienceModelo.

Configurar um modelo de semelhanças

Depois de criar um modelo de semelhanças, estará tudo pronto para configurá-lo para uso em uma colaboração. É possível criar vários modelos de semelhanças configurados com base em um único modelo de semelhanças.

Para configurar um modelo semelhante no AWS Clean Rooms
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console com seu Conta da AWS (se ainda não tiver feito isso).

  2. No painel de navegação à esquerda, selecione Modelagem de ML.

  3. Na guia Modelos de semelhanças configurados, escolha Configurar modelo de semelhanças.

  4. Para Configurar modelo de semelhanças, em Configurar detalhes do modelo de semelhanças:

    1. Insira um Nome e uma Descrição opcional.

    2. Escolha o Modelo de semelhanças que você deseja configurar na lista suspensa.

    3. Escolha o Tamanho mínimo de propagação correspondente que você deseja. Esse é o número mínimo de usuários nos dados do provedor de dados de seed que se sobrepõem aos usuários nos dados de treinamento. Esse valor deve ser maior que 0.

  5. Em Métricas para compartilhar com outros membros, escolha se você deseja que o provedor de dados de seed em sua colaboração receba métricas do modelo, incluindo pontuações de relevância.

  6. Em Localização do destino do segmento de semelhanças, insira o bucket do Amazon S3 para o qual o segmento de semelhanças é exportado. Esse bucket deve estar localizado na mesma região que seus outros recursos.

  7. Em Acesso ao serviço, escolha o Nome do perfil de serviço existente que será usado para acessar essa tabela.

  8. Escolha Configurar modelo semelhante.

  9. Se quiser habilitar Tags para o recurso de tabela configurado, escolha Adicionar nova tag e, em seguida, insira o par Chave e Valor.

Para ver a ação de API correspondente, consulte CreateConfiguredAudienceModel.

Associar um modelo de semelhanças configurado

Depois de configurar um modelo de semelhanças, você pode associá-lo a uma colaboração.

Para associar um modelo semelhante configurado em AWS Clean Rooms
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console com seu Conta da AWS (se ainda não tiver feito isso).

  2. No painel de navegação à esquerda, escolha Colaborações.

  3. Na guia Com associação ativa, escolha uma colaboração.

  4. Na guia Modelagem de ML, escolha Associar modelo de semelhanças.

  5. Para Associar modelo de semelhanças configurado, em Associar detalhes do modelo de semelhanças:

    1. Insira um Nome para o modelo de público configurado associado.

    2. Insira uma Descrição da tabela.

      A descrição ajuda a diferenciar entre outros modelos de público configurados associados com nomes semelhantes.

  6. Para Modelo de semelhanças configurado, escolha um modelo de semelhanças configurado na lista suspensa.

  7. Selecione Associar.

Para a ação de API correspondente, consulte CreateConfiguredAudienceModelAssociação.

Atualizar um modelo semelhante configurado

Depois de associar um modelo semelhante configurado, você pode atualizá-lo para alterar informações como nome, métricas a serem compartilhadas ou a localização de saída do Amazon S3.

Para atualizar um modelo semelhante configurado associado no AWS Clean Rooms
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console com seu Conta da AWS (se ainda não tiver feito isso).

  2. No painel de navegação esquerdo, escolha Modelagem de ML.

  3. Na guia Modelos semelhantes configurados, escolha um modelo semelhante configurado e selecione Editar.

  4. Para Configurar modelo de semelhanças, em Configurar detalhes do modelo de semelhanças:

    1. Escolha o modelo Lookalike que você deseja configurar na lista suspensa.

    2. Escolha o Tamanho mínimo de propagação correspondente que você deseja. Esse é o número mínimo de usuários nos dados do provedor de dados de seed que se sobrepõem aos usuários nos dados de treinamento. Esse valor deve ser maior que 0.

  5. Em Métricas para compartilhar com outros membros, escolha se você deseja que o provedor de dados de seed em sua colaboração receba métricas do modelo, incluindo pontuações de relevância.

  6. Em Localização do destino do segmento de semelhanças, insira o bucket do Amazon S3 para o qual o segmento de semelhanças é exportado. Esse bucket deve estar localizado na mesma região que seus outros recursos.

  7. Em Acesso ao serviço, escolha o Nome do perfil de serviço existente que será usado para acessar essa tabela.

  8. Para Configuração avançada do tamanho do compartimento, escolha como você deseja configurar os tamanhos do compartimento de público.

  9. Escolha Salvar alterações.

Para ver a ação de API correspondente, consulte UpdateConfiguredAudienceModel.

Trabalhando com segmentos semelhantes (provedor de dados iniciais)

Criar um segmento de semelhanças

Um segmento de semelhanças é um subconjunto dos dados de treinamento que mais se assemelha aos dados de seed.

Para criar um segmento semelhante no AWS Clean Rooms
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console com seu Conta da AWS (se ainda não tiver feito isso).

  2. No painel de navegação à esquerda, escolha Colaborações.

  3. Na guia Com associação ativa, escolha uma colaboração.

  4. Na guia Modelagem de ML, escolha Criar segmento de semelhanças.

  5. Em Criar segmento de semelhanças, para Detalhes do segmento de semelhanças, insira um Nome e uma Descrição opcional.

  6. Para Perfis de propagação, escolha a Fonte de entrada do Amazon S3 em que seus dados de propagação são armazenados.

  7. Em Acesso ao serviço, escolha o Nome do perfil de serviço existente que será usado para acessar essa tabela.

  8. Se você quiser habilitar Tags para o conjunto de dados de treinamento, escolha Adicionar nova tag e insira o par de Chave e Valor.

  9. Escolha Criar segmento de semelhanças.

Para ver a ação de API correspondente, consulte StartAudienceGenerationJob.

Exportar um segmento de semelhanças

Depois de criar um segmento de semelhanças, é possível exportar os dados para um bucket do Amazon S3.

Para exportar um segmento semelhante em AWS Clean Rooms
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console com seu Conta da AWS (se ainda não tiver feito isso).

  2. No painel de navegação à esquerda, escolha Colaborações.

  3. Na guia Com associação ativa, escolha uma colaboração.

  4. Na guia Modelagem de ML, selecione um segmento de semelhanças e escolha Exportar.

  5. Para Exportar modelo de semelhanças, em Exportar detalhes do modelo de semelhanças, insira um Nome e uma Descrição opcional.

  6. Em Tamanho do segmento, escolha o tamanho desejado para o segmento exportado.

  7. Escolha Exportar.

Para ver a ação de API correspondente, consulte StartAudienceExportJob.

Próximas etapas

Agora que você criou um modelo de semelhanças e exportou um segmento de seed, está tudo pronto para: