AWS Clean Rooms ML에서 구성된 모델 알고리즘 연결 - AWS Clean Rooms

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS Clean Rooms ML에서 구성된 모델 알고리즘 연결

모델 알고리즘을 구성한 후에는 모델 알고리즘을 공동 작업에 연결할 준비가 된 것입니다. 모델 알고리즘을 연결하면 공동 작업의 모든 구성원이 모델 알고리즘을 사용할 수 있습니다.

다음 이미지는 컨테이너 훈련 이미지를 생성하고 모델 알고리즘을 구성한 후 구성된 모델 알고리즘을 마지막 단계로 연결하는 것을 보여줍니다.

사용자 지정 ML 모델을 제공하는 방법에 대한 개요입니다.
Console
참고

모델 알고리즘이 연결된 후에는 편집할 수 없습니다. 변경하기 위해 연결된 모델 알고리즘을 삭제하고 새 모델 알고리즘을 연결할 수 있습니다.

사용자 지정 ML 모델 알고리즘을 연결하려면(콘솔)
  1. 에 로그인 AWS Management Console 하고 https://console.aws.amazon.com/cleanrooms AWS Clean Rooms 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 사용자 지정 ML 모델을 선택합니다.

  3. 사용자 지정 ML 모델 페이지에서 공동 작업에 연결할 구성된 모델 알고리즘을 선택한 다음 공동 작업에 연결을 선택합니다.

  4. 구성된 모델 알고리즘 연결 창에서 연결할 공동 작업을 선택합니다.

  5. 공동 작업 선택을 선택합니다.

  6. 모델 알고리즘 연결 페이지의 모델 알고리즘 연결 세부 정보에 이름 및 선택적 설명을 입력합니다.

  7. 모델 알고리즘에서 구성된 모델 알고리즘을 선택합니다.

  8. 훈련된 모델 내보내기 개인 정보 구성의 경우

    1. 모델 파일을 내보내려면 모델 파일 확인란을 선택합니다.

    2. 출력 파일을 내보내려면 출력 파일 확인란을 선택합니다.

    3. 내보낸 데이터의 최대 크기 값을 입력합니다. 값은 0.01에서 10 사이여야 합니다.

  9. (선택 사항) 전체 오류 로그 또는 더 짧은 오류 요약을 멤버에게 보내려면 훈련된 모델 추론 작업 개인 정보 보호 구성에서

    1. 전체 로그의 드롭다운 목록에서 계정 IDs 하나 이상 선택합니다.

    2. (선택 사항) 필터 패턴과 일치하는 로그를 보내려면 필터 패턴을 입력합니다.

    3. (선택 사항) 다른 계정과 선택적 필터 패턴을 추가하려면 로그 정책 추가를 선택합니다.

    4. 오류 요약의 드롭다운 목록에서 계정 IDs 하나 이상 선택합니다.

    5. (선택 사항) 수정할 개체를 하나 이상 선택하여 오류 로그 또는 오류 요약에서 수정할 개체를 지정합니다.

      • PII - 개인 식별 정보 수정

      • 숫자 - 숫자 수정

      • 사용자 지정 - 사용자 지정 수정 패턴을 기반으로 수정

      1. 이전 단계에서 사용자 지정을 선택한 경우 사용자 지정 수정 패턴을 입력합니다. 이 패턴에 일치하는 정보를 로깅합니다.

      2. (선택 사항) 다른 사용자 지정 수정 패턴을 추가하려면 다른 사용자 지정 패턴 추가를 선택합니다.

  10. (선택 사항) 훈련된 모델 지표를 구성하려면 훈련된 모델 지표 구성의 드롭다운 목록에서 노이즈 수준을 선택합니다.

    없음, 낮음, 중간음을 선택할 수 있습니다.

  11. (선택 사항) 최대 아티팩트 크기를 설정하려면 아티팩트 구성에서 최대 아티팩트 크기 값을 입력합니다. 값은 0.01에서 10 사이여야 합니다.

  12. (선택 사항) 태그를 활성화하려면 새 태그 추가를 선택한 다음 쌍을 입력합니다.

  13. 연결을 선택합니다.

API

사용자 지정 ML 모델 알고리즘을 연결하려면(API)

특정 파라미터로 다음 코드를 실행합니다.

또한 다양한 로그에 액세스할 수 있는 사용자를 정의하고, 고객이 정규식을 정의하도록 허용하며, 훈련 모델 출력 또는 추론 결과에서 내보낼 수 있는 데이터의 양을 정의하는 개인 정보 보호 정책을 제공합니다.

참고

구성된 모델 알고리즘 연결은 변경할 수 없습니다.

import boto3 acr_ml_client= boto3.client('cleanroomsml') acr_ml_client.create_configured_model_algorithm_association( name='configured_model_algorithm_association_name', description='purpose of the association', configuredModelAlgorithmArn='arn:aws:cleanrooms-ml:region:account:membership/membershipIdentifier/configured-model-algorithm/identifier', privacyConfiguration={ "policies": { "trainedModelExports": { "filesToExport": ['files to export'], "containerLogs": [ { "allowedAccountIds": ['member_account_id'], "filterPattern": ['filter pattern'], "logRedactionConfiguration": { "entitiesToRedact": [ 'ALL_PERSONALLY_IDENTIFIABLE_INFORMATION', 'NUMBERS', 'CUSTOM' ], "customEntityConfig": { "customDataIdentifiers": [ 'custom_regex_1', 'custom_regex_2' ] } } } ], "containerMetrics": { "noiseLevel": 'noise value' }, "maxArtifactSize": { "unit": 'unit', "value": 'number' } }, "trainedModelInferenceJobs": { "containerLogs": [ { "allowedAccountIds": ['member_account_id'], "filterPattern": ['filter pattern'], "logRedactionConfiguration": { "entitiesToRedact": [ 'ALL_PERSONALLY_IDENTIFIABLE_INFORMATION', 'NUMBERS', 'CUSTOM' ], "customEntityConfig": { "customDataIdentifiers": [ 'custom_regex_1', 'custom_regex_2' ] } } } ], "maxOutputSize": { "unit": 'unit', "value": 'number' } } } }, tags={ 'tag': 'tag' } )

구성된 모델 알고리즘이 공동 작업에 연결된 후 훈련 데이터 공급자는 테이블에 공동 작업 분석 규칙을 추가해야 합니다. 이 규칙을 사용하면 구성된 모델 알고리즘 연결이 구성된 테이블에 액세스할 수 있습니다. 기여하는 모든 훈련 데이터 공급자는 다음 코드를 실행해야 합니다.

import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( membershipIdentifier= 'membership_id', configuredTableAssociationIdentifier= 'configured_table_association_id', analysisRuleType= 'CUSTOM', analysisRulePolicy = { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['arn:aws:cleanrooms-ml:region:*:membership/*/configured-model-algorithm-association/*''], 'allowedResultReceivers': [] } } } )
참고

구성된 모델 알고리즘 연결은 변경할 수 없으므로 사용자 지정 모델 구성의 처음 몇 번의 반복 allowedAdditionalAnalyses 중에에서 와일드카드를 사용하기 위해 모델을 허용 목록에 추가하려는 데이터 공급자를 훈련하는 것이 좋습니다. 이를 통해 모델 공급자는 다른 훈련 공급자가 업데이트된 모델 코드를 데이터로 훈련하기 전에 다시 연결할 필요 없이 코드를 반복할 수 있습니다.