Contribution de données de formation dans AWS Clean Rooms ML - AWS Clean Rooms

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Contribution de données de formation dans AWS Clean Rooms ML

Une fois que le créateur de la collaboration a créé la collaboration et que les membres invités l'ont rejoint, vous êtes prêt à apporter des données de formation à la collaboration. Tout membre peut fournir des données de formation.

Console
Pour fournir des données d'entraînement (console)
  1. Connectez-vous à la AWS Clean Rooms console AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/cleanrooms.

  2. Dans le volet de navigation de gauche, choisissez Tables.

  3. Sur la page Tables, choisissez Configurer une nouvelle table.

  4. Pour Configurer une nouvelle table, pour Source de données, choisissez Amazon S3, Amazon Athena ou Snowflake et effectuez les étapes suivantes, en fonction de votre source de données :

    Si vous utilisez Alors
    Amazon S3
    1. Choisissez une base de données dans la liste déroulante, puis sélectionnez la table dans la base de données.

    2. Pour les colonnes autorisées dans les collaborations, sélectionnez Toutes les colonnes ou Liste personnalisée.

    3. Pour les détails de la table configurée, fournissez le nom et une description facultative pour cette table.

    4. Si vous souhaitez signaler les métriques du modèle, entrez le nom des métriques et l'instruction Regex qui recherchera la métrique dans les journaux de sortie.

    5. Si vous souhaitez activer les balises pour la ressource de table configurée, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

    Amazon Athena
    1. Choisissez une base de données dans la liste déroulante, puis sélectionnez la table dans la base de données.

    2. Pour les colonnes autorisées dans les collaborations, sélectionnez Toutes les colonnes ou Liste personnalisée.

    3. Pour les détails de la table configurée, fournissez le nom et une description facultative pour cette table.

    4. Si vous souhaitez signaler les métriques du modèle, entrez le nom des métriques et l'instruction Regex qui recherchera la métrique dans les journaux de sortie.

    5. Si vous souhaitez activer les balises pour la ressource de table configurée, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

    Snowflake
    1. Spécifiez les informations d'identification Snowflake en utilisant un ARN secret existant ou en stockant un nouveau secret pour cette table.

    2. Pour les détails de la table et du schéma Snowflake, entrez les détails manuellement ou importez-les automatiquement.

    3. Pour le schéma, entrez le nom de la colonne et choisissez le type de données dans la liste déroulante.

    4. Si vous souhaitez activer les balises pour la ressource de table configurée, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

  5. Choisissez Configurer une nouvelle table.

  6. Sur la page des détails de la table, choisissez Configurer la règle d'analyse pour configurer une règle d'analyse personnalisée pour cette table. Une règle d'analyse personnalisée limite l'accès à vos données. Vous pouvez autoriser un ensemble spécifique de requêtes préautorisées sur vos données ou autoriser un ensemble spécifique de comptes à interroger vos données.

    1. Pour le type de règle d'analyse, choisissez Personnalisé et pour Méthode de création, choisissez Flux guidé.

    2. Choisissez Suivant.

    3. Pour Spécifier les contrôles d'analyse, choisissez entre Vérifier chaque nouvelle analyse et Autoriser toute analyse réalisée par des collaborateurs spécifiques.

    4. Choisissez Suivant.

    5. (Facultatif) Pour les commandes Spécifier les résultats d'analyse, pour les colonnes non autorisées en sortie, indiquez si vous souhaitez exclure des colonnes de la sortie. Si vous choisissez Aucune, aucune colonne n'est exclue de la sortie. Si vous choisissez Liste personnalisée, vous pouvez spécifier certaines colonnes qui seront supprimées de la sortie.

    6. Pour les analyses supplémentaires appliquées à la sortie, spécifiez si vous souhaitez autoriser, refuser ou exiger une analyse supplémentaire avant que les résultats ne soient générés.

    7. Choisissez Suivant.

    8. (Facultatif) Pour Définir la confidentialité différentielle, choisissez Désactiver.

    9. Choisissez Suivant.

    10. Consultez les informations de la page Révision et configuration, puis choisissez Configurer la règle d'analyse.

  7. Sur la page des détails du tableau, choisissez Associer à la collaboration.

  8. Dans la boîte de dialogue Associer une table, sélectionnez la collaboration à laquelle vous souhaitez associer cette table et choisissez Choisir une collaboration.

  9. Sur la page Associer la table, passez en revue et vérifiez les informations figurant dans Détails de l'association de tables, Accès au service et Tags. Choisissez Associer une table.

  10. Dans le tableau Tables associées à votre compte, sélectionnez le bouton radio situé à côté du tableau que vous venez d'associer. Dans le menu Actions, choisissez Configurer dans le groupe de règles d'analyse de collaboration.

  11. Sur la page Configurer les règles d'analyse de collaboration, dans Analyses supplémentaires autorisées, indiquez si des membres de la collaboration ou des membres spécifiques de la collaboration peuvent effectuer des analyses supplémentaires.

    Pour la livraison des résultats, choisissez les membres autorisés à recevoir des résultats à partir des résultats des requêtes.

  12. Choisissez Configurer la règle d'analyse.

API

Pour fournir des données d'entraînement (API)

  1. Configurez une AWS Glue table existante à utiliser en AWS Clean Rooms fournissant la table et les colonnes qui peuvent être utilisées.

    Exécutez le code suivant avec vos paramètres spécifiques.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table( name='configured_table_name', tableReference= { 'glue': { 'tableName': 'glue_table_name', 'databaseName': 'glue_database_name' } }, analysisMethod="DIRECT_QUERY", allowedColumns=["column1", "column2", "column3",...] )
  2. Configurez une règle d'analyse personnalisée qui limite l'accès à vos données. Vous pouvez autoriser un ensemble spécifique de requêtes préautorisées sur vos données ou autoriser un ensemble spécifique de comptes à interroger vos données.

    Exécutez le code suivant avec vos paramètres spécifiques.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_analysis_rule( configuredTableIdentifier='configured_table_id', analysisRuleType='CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAnalyses': ['ANY_QUERY'], 'allowedAnalysisProviders': ['query_runner_account'], 'additionalAnalyses': "REQUIRED" } } } )

    Dans cet exemple, un compte spécifique est autorisé à exécuter n'importe quelle requête sur les données et une analyse supplémentaire est requise.

  3. Associez une table configurée à la collaboration et attribuez un rôle d'accès aux services aux AWS Glue tables.

    Exécutez le code suivant avec vos paramètres spécifiques.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association( name='configured_table_association_name', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', roleArn='arn:aws:iam::account:role/role_name' )
    Note

    Ce rôle de service dispose d'autorisations d'accès aux tables. Le rôle de service ne peut être assumé que AWS Clean Rooms pour exécuter les requêtes autorisées au nom du membre autorisé à effectuer des requêtes. Aucun membre de la collaboration (autre que le propriétaire des données) n'a accès aux tables sous-jacentes de la collaboration. Le propriétaire des données peut désactiver la confidentialité différentielle pour que ses tables puissent être consultées par d'autres membres.

  4. Enfin, ajoutez une règle d'analyse à l'association de tables configurée.

    Exécutez le code suivant avec vos paramètres spécifiques.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( configuredTableAssociationIdentifier='configured_table_association_identifier', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', analysisRuleType = 'CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['configured_model_algorithm_association_arns'], 'allowedResultReceivers': ['query_runner_account'] } } } )