AWS Clean Rooms ML에서 훈련 데이터 기여 - AWS Clean Rooms

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS Clean Rooms ML에서 훈련 데이터 기여

공동 작업 생성자가 공동 작업을 생성하고 초대된 구성원이 참여하면 공동 작업에 훈련 데이터를 제공할 준비가 된 것입니다. 모든 구성원이 훈련 데이터를 제공할 수 있습니다.

Console
훈련 데이터를 제공하려면(콘솔)
  1. 에 로그인 AWS Management Console 하고 https://console.aws.amazon.com/cleanrooms AWS Clean Rooms 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 테이블을 선택합니다.

  3. 테이블 페이지에서 새 테이블 구성을 선택합니다.

  4. 새 테이블 구성데이터 소스에서 Amazon S3, Amazon Athena 또는 Snowflake를 선택하고 데이터 소스에 따라 다음 단계를 완료합니다.

    를 사용하는 경우 Then
    Amazon S3
    1. 드롭다운 목록에서 데이터베이스를 선택한 다음 데이터베이스에서 테이블을 선택합니다.

    2. 공동 작업에서 허용되는 열의 경우 모든 열 또는 사용자 지정 목록을 선택합니다.

    3. 구성된 테이블 세부 정보에이 테이블에 대한 이름 및 선택적 설명을 입력합니다.

    4. 모델 지표를 보고하려면 지표의 이름과 출력 로그를 검색하여 지표를 찾을 정규식 문을 입력합니다.

    5. 구성된 테이블 리소스에 대해 태그를 활성화하려면 새 태그 추가를 선택한 다음 쌍을 입력합니다.

    Amazon Athena
    1. 드롭다운 목록에서 데이터베이스를 선택한 다음 데이터베이스에서 테이블을 선택합니다.

    2. 공동 작업에서 허용되는 열의 경우 모든 열 또는 사용자 지정 목록을 선택합니다.

    3. 구성된 테이블 세부 정보에이 테이블에 대한 이름 및 선택적 설명을 입력합니다.

    4. 모델 지표를 보고하려면 지표의 이름과 출력 로그를 검색하여 지표를 찾을 정규식 문을 입력합니다.

    5. 구성된 테이블 리소스에 대해 태그를 활성화하려면 새 태그 추가를 선택한 다음 쌍을 입력합니다.

    Snowflake
    1. 기존 보안 암호 ARN을 사용하거나이 테이블에 대한 새 보안 암호를 저장하여 Snowflake 보안 인증 정보를 지정합니다.

    2. Snowflake 테이블 및 스키마 세부 정보에 세부 정보를 수동으로 입력하거나 세부 정보를 자동으로 가져옵니다.

    3. 스키마열 이름을 입력하고 드롭다운 목록에서 데이터 유형을 선택합니다.

    4. 구성된 테이블 리소스에 대해 태그를 활성화하려면 새 태그 추가를 선택한 다음 쌍을 입력합니다.

  5. 새 클라이언트 구성를 선택합니다.

  6. 테이블 세부 정보 페이지에서 분석 규칙 구성을 선택하여이 테이블에 대한 사용자 지정 분석 규칙을 구성합니다. 사용자 지정 분석 규칙은 데이터에 대한 액세스를 제한합니다. 데이터에 대해 특정 사전 승인된 쿼리 집합을 허용하거나 특정 계정 집합이 데이터를 쿼리하도록 허용할 수 있습니다.

    1. 분석 규칙 유형에서 사용자 지정을 선택하고 생성 방법에서 안내 흐름을 선택합니다.

    2. 다음을 선택합니다.

    3. 분석 컨트롤 지정에서 각 새 분석 검토특정 공동 작업자의 분석 허용 중에서 선택합니다.

    4. 다음을 선택합니다.

    5. (선택 사항) 분석 결과 컨트롤 지정에서 출력에 허용되지 않는 열에 대해 출력에서 열을 제외할지 여부를 지정합니다. 없음을 선택하면 출력에서 열이 제외되지 않습니다. 사용자 지정 목록을 선택하면 출력에서 제거할 특정 열을 지정할 수 있습니다.

    6. 출력에 적용된 추가 분석의 경우 결과가 생성되기 전에 추가 분석을 허용, 거부 또는 요구할지 여부를 지정합니다.

    7. 다음을 선택합니다.

    8. (선택 사항) 차등 프라이버시 설정에서 끄기를 선택합니다.

    9. 다음을 선택합니다.

    10. 검토 및 구성 페이지의 정보를 검토한 다음 분석 규칙 구성을 선택합니다.

  7. 테이블 세부 정보 페이지에서 공동 작업에 연결을 선택합니다.

  8. 테이블 연결 대화 상자에서이 테이블을 연결할 공동 작업을 선택하고 공동 작업 선택을 선택합니다.

  9. 테이블 연결 페이지에서 테이블 연결 세부 정보, 서비스 액세스태그의 정보를 검토하고 확인합니다. 연결 테이블을 선택합니다.

  10. 연결된 테이블 테이블에서 방금 연결한 테이블 옆의 라디오 버튼을 선택합니다. 작업 메뉴에서 협업 분석 규칙 그룹에서 구성을 선택합니다.

  11. 공동 작업 분석 규칙 구성 페이지의 허용된 추가 분석에서 공동 작업 구성원 또는 특정 공동 작업 구성원이 추가 분석을 수행할 수 있는지 여부를 선택합니다.

    결과 전송에서 쿼리 출력에서 결과를 수신할 수 있는 멤버를 선택합니다.

  12. 분석 규칙 구성을 선택합니다.

API

훈련 데이터를 제공하려면(API)

  1. 사용할 수 있는 AWS Glue 테이블과 열을 AWS Clean Rooms 제공하여에서 사용할 기존 테이블을 구성합니다.

    특정 파라미터로 다음 코드를 실행합니다.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table( name='configured_table_name', tableReference= { 'glue': { 'tableName': 'glue_table_name', 'databaseName': 'glue_database_name' } }, analysisMethod="DIRECT_QUERY", allowedColumns=["column1", "column2", "column3",...] )
  2. 데이터에 대한 액세스를 제한하는 사용자 지정 분석 규칙을 구성합니다. 데이터에 대해 특정 사전 승인된 쿼리 집합을 허용하거나 특정 계정 집합이 데이터를 쿼리하도록 허용할 수 있습니다.

    특정 파라미터로 다음 코드를 실행합니다.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_analysis_rule( configuredTableIdentifier='configured_table_id', analysisRuleType='CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAnalyses': ['ANY_QUERY'], 'allowedAnalysisProviders': ['query_runner_account'], 'additionalAnalyses': "REQUIRED" } } } )

    이 예제에서는 특정 계정이 데이터에 대한 쿼리를 실행할 수 있으며 추가 분석이 필요합니다.

  3. 구성된 테이블을 공동 작업에 연결하고 AWS Glue 테이블에 서비스 액세스 역할을 제공합니다.

    특정 파라미터로 다음 코드를 실행합니다.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association( name='configured_table_association_name', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', roleArn='arn:aws:iam::account:role/role_name' )
    참고

    이 서비스 역할에는 테이블에 대한 권한이 있습니다. 서비스 역할은 쿼리할 수 있는 구성원을 대신하여 허용된 쿼리를 실행 AWS Clean Rooms 하기 위해 에서만 수임할 수 있습니다. 공동 작업 구성원(데이터 소유자 제외)은 공동 작업의 기본 테이블에 액세스할 수 없습니다. 데이터 소유자는 차등 프라이버시를 해제하여 다른 멤버가 테이블을 쿼리할 수 있도록 할 수 있습니다.

  4. 마지막으로 구성된 테이블 연결에 분석 규칙을 추가합니다.

    특정 파라미터로 다음 코드를 실행합니다.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( configuredTableAssociationIdentifier='configured_table_association_identifier', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', analysisRuleType = 'CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['configured_model_algorithm_association_arns'], 'allowedResultReceivers': ['query_runner_account'] } } } )