AWS Clean Rooms ML - AWS Clean Rooms

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS Clean Rooms ML

AWS Clean Rooms ML

AWS Clean Rooms ML은 두 당사자가 데이터를 서로 공유할 필요 없이 데이터에서 유사한 사용자를 식별할 수 있는 개인 정보 보호 방법을 제공합니다. 첫 번째 당사자는 교육 데이터를 가져와 유사 모델을 생성 및 구성하고 이를 협업과 연결할 수 AWS Clean Rooms 있도록 합니다. 그런 다음 두 번째 당사자는 시드 데이터를 AWS Clean Rooms 가져와 훈련 데이터와 유사한 유사한 세그먼트를 생성합니다.

작동하는 방식에 대한 자세한 설명은 교차 계정 작업 섹션을 참조하세요.

  • 훈련 데이터 공급자 – 훈련 데이터를 제공하고 유사 모델을 생성 및 구성한 다음 해당 유사 모델을 공동 작업에 연결하는 역할을 합니다.

  • 시드 데이터 공급자 - 시드 데이터를 제공하고 유사 세그먼트를 생성하여 유사 세그먼트를 내보내는 역할을 합니다.

  • 훈련 데이터 - 유사 모델을 생성하는 데 사용되는 훈련 데이터 공급자의 데이터입니다. 훈련 데이터는 사용자 동작의 유사성을 측정하는 데 사용됩니다.

    훈련 데이터에는 사용자 ID, 항목 ID 및 타임스탬프 열이 포함되어야 합니다. 필요에 따라 훈련 데이터에 다른 상호작용을 수치적 특징 또는 범주형 특징으로 포함할 수 있습니다. 상호작용의 예로는 시청한 동영상, 구매한 항목, 읽은 기사 목록 등이 있습니다.

  • 시드 데이터 - 유사 세그먼트를 만드는 데 사용되는 시드 데이터 공급자의 데이터입니다. 유사 세그먼트는 시드 사용자와 가장 유사한 훈련 데이터의 사용자 집합입니다.

  • 유사 모델 - 다른 데이터 세트에서 유사한 사용자를 찾는 데 사용되는 훈련 데이터의 기계 학습 모델입니다.

    API를 사용할 때 대상 모델이라는 용어는 유사 모델과 동일하게 사용됩니다. 예를 들어, CreateAudienceModel API를 사용하여 유사 모델을 만들 수 있습니다.

  • 유사 세그먼트 — 시드 데이터와 가장 유사한 훈련 데이터의 하위 집합입니다.

    API를 사용할 때는 API를 사용하여 유사 세그먼트를 생성합니다. StartAudienceGenerationJob

훈련 데이터 공급자의 데이터는 시드 데이터 공급자와 공유되지 않으며 시드 데이터 공급자의 데이터도 훈련 데이터 공급자와 공유되지 않습니다. 유사 세그먼트 출력은 훈련 데이터 공급자와 공유되지만 시드 데이터 공급자와는 공유되지 않습니다.

유사 모델에 대한 자세한 내용은 다음 주제를 참조하세요.

ML 작동 방식 AWS Clean Rooms

AWS Clean Rooms ML 작동 방식 개요.

Clean Rooms ML에서는 교육 데이터 공급자와 시드 데이터 제공업체라는 두 당사자가 순차적으로 협력하여 데이터를 협업에 AWS Clean Rooms 적용해야 합니다. 훈련 데이터 공급자가 먼저 완료해야 하는 워크플로는 다음과 같습니다.

  1. 교육 데이터 제공자의 데이터는 사용자 항목 상호 작용이 포함된 AWS Glue 데이터 카탈로그 테이블에 저장해야 합니다. 교육 데이터에는 최소한 사용자 ID 열, 상호 작용 ID 열, 타임스탬프 열이 포함되어야 합니다.

  2. 훈련 데이터 공급자가 훈련 데이터를 등록합니다. AWS Clean Rooms

  3. 훈련 데이터 공급자는 여러 시드 데이터 공급자와 공유할 수 있는 유사 모델을 생성합니다. 유사 모델은 신경망이며, 훈련하는 데 최대 24시간이 걸릴 수 있습니다. 모델은 자동으로 재훈련되지 않으므로 매주 모델을 재훈련시키는 것이 좋습니다.

  4. 훈련 데이터 공급자는 관련성 지표 공유 여부 및 출력 세그먼트의 Amazon S3 위치를 포함하여 유사 모델을 구성합니다. 훈련 데이터 공급자는 단일 유사 모델에서 구성된 유사 모델을 여러 개 생성할 수 있습니다.

  5. 훈련 데이터 공급자는 구성된 대상 모델을 시드 데이터 공급자와 공유하는 공동 작업에 연결합니다.

시드 데이터 공급자가 다음으로 완료해야 하는 워크플로는 다음과 같습니다.

  1. 시드 데이터 공급자의 데이터는 Amazon S3 버킷에 저장해야 합니다.

  2. 시드 데이터 공급자는 훈련 데이터 공급자와 공유하는 공동 작업을 엽니다.

  3. 시드 데이터 공급자는 협업 페이지의 Clean Rooms ML 탭에서 유사한 세그먼트를 생성합니다.

  4. 시드 데이터 공급자는 관련성 지표가 공유된 경우 이를 평가하고 유사 세그먼트를 내보내 AWS Clean Rooms외부에서 사용할 수 있습니다.