Amazon Personalize에 대해 자주 묻는 질문 - Personalize

Amazon Personalize에 대해 자주 묻는 질문

다음은 Personalize의 데이터 가져오기, 학습, 모델 배포, 추천 및 필터와 관련된 자주 묻는 질문에 대한 답변입니다.

더 많은 질문과 답변은 Personalize 샘플 리포지토리의 Personalize 치트 시트를 참조하세요.

데이터 가져오기 및 관리

대량 데이터는 어떤 형식으로 작성해야 하나요?

대량 데이터는 CSV(쉼표로 구분된 값) 형식이어야 합니다. CSV 파일의 첫 행에는 열 헤더가 포함되어 있어야 합니다. CSV 파일의 열 헤더는 데이터세트에서 생성하는 스키마로 매핑되어야 합니다. 데이터에 ASCII로 인코딩되지 않은 문자가 포함된 경우, CSV 파일은 UTF-8 형식으로 인코딩되어야만 합니다. 헤더를 큰따옴표(")로 묶지 마세요. TIMESTAMPCREATION_TIMESTAMP데이터는 UNIX epoch 시간 형식이어야 합니다. 데이터 준비에 대한 자세한 내용은 타임스탬프 데이터단원을 참조하세요. 스키마에 대한 자세한 내용은 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성단원을 참조하세요.

전체 데이터 형식 지침은 Amazon Personalize를 위한 학습 데이터 준비단원을 참조하세요. 데이터 형식을 지정하는 방법을 잘 모르는 경우 SageMaker Data Wrangler(Data Wrangler)를 사용하여 데이터를 준비할 수 있습니다. 자세한 내용은 Amazon SageMaker Data Wrangler를 사용하여 대량 데이터를 준비하고 가져오기단원을 참조하세요.

얼마나 많은 학습 데이터가 필요한가요?

모든 사용 사례(도메인 데이터세트 그룹) 및 사용자 지정 레시피에 대해 상호작용 데이터에 다음이 포함되어야 합니다.

  • 카탈로그의 항목과 상호 작용하는 사용자의 1,000개 이상의 항목 상호 작용 기록. 이러한 상호작용은 대량 가져오기, 스트리밍된 이벤트 또는 둘 다에서 발생할 수 있습니다.

  • 각각 2번 이상의 항목 상호 작용을 갖는 25개 이상의 고유 사용자 ID.

품질 추천의 경우, 각 2번 이상의 항목 상호 작용을 갖는 1,000명 이상의 사용자로부터 50,000건 이상의 항목 상호 작용을 갖는 것이 좋습니다.

빈 항목 상호 작용 데이터 세트로 시작해서 데이터를 충분히 기록했으면 새로 기록된 이벤트만 사용하여 추천자(도메인 데이터 세트 그룹) 또는 사용자 지정 솔루션 버전을 만들 수 있습니다. 일부 레시피와 사용 사례에는 추가 데이터 요구 사항이 있을 수 있습니다. 네트워크 요구 사항에 관한 자세한 내용은 사용 사례 선택단원을 참조하세요. 다른 요구 사항에 대한 자세한 내용은 레시피 선택단원을 참조하세요.

항목 또는 사용자 속성을 업데이트하려면 어떻게 해야 하나요?

Personalize 콘솔 또는 PutItems또는 PutUsers작업을 사용하여 아이템 ID는 같지만 속성이 수정된 항목 또는 사용자를 가져올 수 있습니다.

항목 또는 사용자를 삭제하려면 어떻게 해야 하나요?

Personalize는 특정 항목 또는 사용자 삭제를 지원하지 않습니다. 항목이나 사용자가 추천에 나타나지 않도록 하려면 필터를 사용하여 항목을 제외시킵니다. 자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요.

스키마를 삭제하려면 어떻게 해야 하나요?

스키마는 DeleteSchema작업을 통해서만 삭제할 수 있습니다. Personalize 콘솔을 사용해서는 스키마를 삭제할 수 없습니다.

사용자 지정 솔루션 및 솔루션 버전 생성

어떤 레시피를 사용해야 하나요?

사용하는 Personalize 레시피는 사용 사례에 따라 다릅니다. 사용 사례를 레시피와 일치시키는 방법에 대한 자세한 내용은 레시피 선택단원을 참조하세요. Personalize 치트 시트에도 사용 사례 및 레시피 정보가 포함되어 있습니다.

얼마나 자주 학습해야 하나요?

매주 최소 1회의 학습 빈도로 자동 학습을 사용하는 것이 좋습니다. 자동 학습을 사용하면 추천 사항 관련성을 더 쉽게 유지할 수 있습니다. 학습 빈도는 비즈니스 요구 사항, 사용하는 레시피 및 데이터를 가져오는 빈도에 따라 달라집니다. 자세한 내용은 자동 학습 구성 단원을 참조하십시오. 관련성 유지에 대한 자세한 내용은 추천 관련성 유지 섹션을 참조하세요.

AutoML을 사용해야 하나요?

아니요. 대신 사용 사례를 다른 Personalize 레시피에 맞추고 레시피를 선택하는 것이 좋습니다. 사용 사례를 레시피와 일치시키는 방법에 대한 자세한 내용은 레시피 선택단원을 참조하세요.

모델 배포(사용자 지정 캠페인)

캠페인의 minProvisionedTPS에 대해 무엇을 설정해야 하나요?

minProvisionedTPS가 높으면 비용이 증가합니다. minProvisionedTPS(기본값)의 경우 1부터 시작하는 것이 좋습니다. CloudWatch 지표를 사용하여 사용량을 추적하고 필요에 따라 minProvisionedTPS를 늘리세요.

캠페인 비용을 모니터링하려면 어떻게 해야 하나요?

Personalize Monitor 프로젝트는 Personalize 캠페인을 위한 CloudWatch 대시보드, 사용자 지정 지표, 사용률 경보 및 비용 최적화 기능을 제공합니다. Amazon Personalize 샘플 리포지토리의 Amazon Personalize 모니터를 참조하세요.

캠페인의 최대 트랜잭션 처리량을 설정하려면 어떻게 해야 하나요?

캠페인의 최소 처리량만 설정할 수 있습니다. Personalize 캠페인을 생성할 때 애플리케이션 사용자를 위한 실시간 추천을 생성하기 위한 전용 트랜잭션 용량을 지정합니다. TPS가 minProvisionedTPS이상으로 증가할 경우, Personalize는 프로비저닝 용량을 자동으로 확장 및 축소하지만 minProvisionedTPS이하로는 절대 그렇게 하지 않습니다. 자세한 내용은 초당 최소 프로비저닝 트랜잭션 수 및 자동 스케일링 단원을 참조하십시오.

추천

Personalize 모델이 품질 추천을 생성하고 있는지 어떻게 알 수 있나요?

오프라인 및 온라인 지표(지표를 사용하여 Amazon Personalize 솔루션 버전 평가 참조)와 온라인 테스트(예: A/B 테스트)를 사용하여 솔루션 버전의 성능을 평가합니다. A/B 테스트에 대한 자세한 내용은 A/B 테스트를 통한 추천 영향 측정 섹션을 참조하세요.

배치 추론 작업을 삭제하려면 어떻게 해야 하며, 상태가 "활성"인 이유는 무엇인가요?

배치 추론 작업은 삭제할 수 없습니다. 배치 추론 작업의 상태가 활성이면 작업이 완료된 것입니다. 출력 S3 버킷 또는 폴더의 추천에 액세스할 수 있습니다. 작업이 완료되면 배치 추론 작업으로 인해 추가 비용이 발생하지 않습니다. 하지만 S3와 같은 다른 서비스에서는 입력 및 출력 데이터 저장에 대해 추가 요금이 부과될 수 있습니다.

SIMS 지원 캠페인에서 메타데이터를 기반으로 유사하지 않은 항목을 추천하는 이유는 무엇인가요?

SIMS는 색상이나 가격 같은 항목 메타데이터가 아닌 항목 상호 작용 데이터 세트를 사용하여 유사성을 판단합니다. SIMS는 상호작용 데이터세트의 사용자 이력에서 해당 항목이 동시에 발생한 경우를 식별하여 유사한 항목을 추천합니다. 자세한 내용은 SIMS 레시피단원을 참조하세요.

단일 GetRecommendations API 작업에서 500개 이상의 항목을 가져올 수 있나요?

500개는 단일 GetRecommendations에서 검색할 수 있는 최대 항목 수입니다. 이 값은 늘릴 수 없습니다.

추천 필터링

내 추천이 예상대로 필터링되지 않는 이유는 무엇인가요?

이 오류는 여러 가지 이유로 발생할 수 있습니다.

  • 필터 표현식의 형식이나 구문에 문제가 있을 수 있습니다. 올바른 형식의 필터 표현식의 예는 필터 표현식 예제단원을 참조하세요.

  • Personalize는 이벤트 유형별로 사용자당 가장 최근의 상호작용을 최대 100건까지 고려합니다. 이 할당량은 조정 가능한 할당량입니다. Service Quotas 콘솔을 사용하여 IAM 할당량 증가를 요청할 수 있습니다. 3개월 동안 사용자에 대한 항목 상호 작용을 가져오지 않으면 필터가 더 이상 사용자의 기록 데이터를 고려하지 않습니다. 이 데이터를 고려하려면 사용자의 전체 이벤트 기록을 다시 가져와야 합니다.

자세한 내용은 추천 및 사용자 세그먼트 필터링 단원을 참조하십시오.

이미 구매한 항목을 추천에서 제거하려면 어떻게 해야 하나요?

ECOMMERCE 도메인 데이터세트 그룹의 경우, 추천 제품또는 X를 본 고객도 보는 제품사용 사례를 사용하여 추천자를 생성하면 Personalize는 지정한 사용자 ID 및 Purchase이벤트를 기반으로 사용자가 구매한 항목을 자동으로 필터링합니다.

다른 도메인 데이터세트 그룹 사용 사례 또는 사용자 지정 리소스의 경우 필터를 사용하여 구매한 항목을 제거합니다. 데이터에 Purchased이벤트 유형 속성을 추가하고, PutItems작업을 사용하여 구매 이벤트를 기록하고, 추천에서 구매한 항목을 제거하는 필터를 생성합니다. 예:

EXCLUDE ItemID WHERE Interactions.EVENT_TYPE IN ("purchased")

자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요.