Contribuindo com dados de treinamento no AWS Clean Rooms ML - AWS Clean Rooms

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Contribuindo com dados de treinamento no AWS Clean Rooms ML

Depois que o criador da colaboração criar a colaboração e os membros convidados participarem, você estará pronto para contribuir com dados de treinamento para a colaboração. Qualquer membro pode contribuir com dados de treinamento.

Console
Para contribuir com dados de treinamento (console)
  1. Faça login no AWS Management Console e abra o AWS Clean Rooms console em https://console.aws.amazon.com/cleanrooms.

  2. No painel de navegação à esquerda, selecione Tables (Tabelas).

  3. Na página Tabelas, escolha Configurar nova tabela.

  4. Para Configurar nova tabela, para fonte de dados, escolha Amazon S3, Amazon Athena ou Snowflake e conclua as seguintes etapas, com base na sua fonte de dados:

    Se você estiver usando Então
    Amazon S3
    1. Escolha um banco de dados na lista suspensa e selecione a tabela no banco de dados.

    2. Em Colunas permitidas em colaborações, escolha Todas as colunas ou Lista personalizada.

    3. Para detalhes da tabela configurada, forneça o Nome e uma Descrição opcional para essa tabela.

    4. Se você quiser relatar as métricas do modelo, insira o nome das métricas e a instrução Regex que pesquisará os registros de saída para encontrar a métrica.

    5. Se quiser habilitar Tags para o recurso de tabela configurado, escolha Adicionar nova tag e, em seguida, insira o par Chave e Valor.

    Amazon Athena
    1. Escolha um banco de dados na lista suspensa e selecione a tabela no banco de dados.

    2. Em Colunas permitidas em colaborações, escolha Todas as colunas ou Lista personalizada.

    3. Para detalhes da tabela configurada, forneça o Nome e uma Descrição opcional para essa tabela.

    4. Se você quiser relatar as métricas do modelo, insira o nome das métricas e a instrução Regex que pesquisará os registros de saída para encontrar a métrica.

    5. Se quiser habilitar Tags para o recurso de tabela configurado, escolha Adicionar nova tag e, em seguida, insira o par Chave e Valor.

    Snowflake
    1. Especifique as credenciais do Snowflake usando um ARN secreto existente ou armazenando um novo segredo para essa tabela.

    2. Para obter detalhes da tabela e do esquema do Snowflake, insira os detalhes manualmente ou importe os detalhes automaticamente.

    3. Para o Esquema, insira o nome da coluna e escolha o Tipo de dados na lista suspensa.

    4. Se quiser habilitar Tags para o recurso de tabela configurado, escolha Adicionar nova tag e, em seguida, insira o par Chave e Valor.

  5. Escolha Configurar nova tabela.

  6. Na página de detalhes da tabela, escolha Configurar regra de análise para configurar uma regra de análise personalizada para essa tabela. Uma regra de análise personalizada limita o acesso aos seus dados. Você pode permitir um conjunto específico de consultas pré-autorizadas em seus dados ou permitir que um conjunto específico de contas consulte seus dados.

    1. Em Tipo de regra de análise, escolha Personalizado e, em Método de criação, escolha Fluxo guiado.

    2. Escolha Próximo.

    3. Em Especificar controles de análise, escolha entre Revisar cada nova análise e Permitir qualquer análise por colaboradores específicos.

    4. Escolha Próximo.

    5. (Opcional) Para Especificar controles de resultados de análise, para Colunas não permitidas na saída, especifique se você deseja excluir alguma coluna da saída. Se você escolher Nenhuma, nenhuma coluna será excluída da saída. Se você escolher Lista personalizada, poderá especificar determinadas colunas que serão removidas da saída.

    6. Em Análises adicionais aplicadas à saída, especifique se você deseja permitir, negar ou exigir uma análise adicional antes que os resultados sejam gerados.

    7. Escolha Próximo.

    8. (Opcional) Em Definir privacidade diferencial, escolha Desativar.

    9. Escolha Próximo.

    10. Revise as informações na página Revisar e configurar e escolha Configurar regra de análise.

  7. Na página de detalhes da tabela, escolha Associar à colaboração.

  8. Na caixa de diálogo Associar tabela, selecione a colaboração à qual você deseja associar essa tabela e escolha Escolher colaboração.

  9. Na página Associar tabela, revise e verifique as informações em Detalhes da associação da tabela, acesso ao serviço e Tags. Escolha Associar tabela.

  10. Na tabela Tabelas associadas à sua tabela, selecione o botão de rádio ao lado da tabela que você acabou de associar. No menu Ações, escolha Configurar no grupo de regras de análise de colaboração.

  11. Na página Configurar regra de análise de colaboração, em Análises adicionais permitidas, escolha se algum membro da colaboração ou membros específicos da colaboração pode realizar análises adicionais.

    Em Entrega de resultados, escolha quais membros podem receber resultados das saídas da consulta.

  12. Selecione Configurar regra de análise.

API

Para contribuir com dados de treinamento (API)

  1. Configure uma AWS Glue tabela existente para uso em AWS Clean Rooms fornecendo a tabela e as colunas que podem ser usadas.

    Execute o código a seguir com seus parâmetros específicos.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table( name='configured_table_name', tableReference= { 'glue': { 'tableName': 'glue_table_name', 'databaseName': 'glue_database_name' } }, analysisMethod="DIRECT_QUERY", allowedColumns=["column1", "column2", "column3",...] )
  2. Configure uma regra de análise personalizada que limite o acesso aos seus dados. Você pode permitir um conjunto específico de consultas pré-autorizadas em seus dados ou permitir que um conjunto específico de contas consulte seus dados.

    Execute o código a seguir com seus parâmetros específicos.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_analysis_rule( configuredTableIdentifier='configured_table_id', analysisRuleType='CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAnalyses': ['ANY_QUERY'], 'allowedAnalysisProviders': ['query_runner_account'], 'additionalAnalyses': "REQUIRED" } } } )

    Neste exemplo, uma conta específica pode executar qualquer consulta nos dados e uma análise adicional é necessária.

  3. Associe uma tabela configurada à colaboração e forneça uma função de acesso ao serviço às AWS Glue tabelas.

    Execute o código a seguir com seus parâmetros específicos.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association( name='configured_table_association_name', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', roleArn='arn:aws:iam::account:role/role_name' )
    nota

    Esse perfil de serviço tem permissões para as tabelas. A função de serviço só pode ser assumida AWS Clean Rooms executando consultas permitidas em nome do membro que pode consultar. Nenhum membro da colaboração (exceto o proprietário dos dados) tem acesso às tabelas subjacentes na colaboração. O proprietário dos dados pode desativar a privacidade diferencial para disponibilizar suas tabelas para consulta por outros membros.

  4. Por fim, adicione uma regra de análise à associação de tabela configurada.

    Execute o código a seguir com seus parâmetros específicos.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( configuredTableAssociationIdentifier='configured_table_association_identifier', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', analysisRuleType = 'CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['configured_model_algorithm_association_arns'], 'allowedResultReceivers': ['query_runner_account'] } } } )