기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 변환
Data Wrangler에서 데이터를 변환하려면 데이터 흐름에 변환 단계를 추가합니다. Data Wrangler에는 Personalize용 맵 열 변환을 포함하여 데이터를 준비하는 데 사용할 수 있는 300개 이상의 변환이 포함되어 있습니다. 또한 일반 Data Wrangler 변환을 사용하여 특이값, 유형 문제, 누락된 값과 같은 문제를 해결할 수 있습니다.
데이터 변환을 완료한 후에는 Data Wrangler로 데이터를 분석할 수 있습니다. 또는 Data Wrangler에서 데이터 준비를 완료한 경우 데이터를 처리하고 Personalize로 가져올 수도 있습니다. 데이터 분석에 대한 자세한 내용은 시각화 및 데이터 인사이트 생성단원을 참조하세요. 데이터 처리 및 가져오기에 대한 자세한 내용은 데이터를 처리하고 Personalize로 가져오기단원을 참조하세요.
Personalize용 매핑 열
Personalize 요구 사항을 충족하도록 데이터를 변환하려면 Personalize용 맵 열 변환을 추가하고, 열을 Personalize의 필수 및 선택 필드에 매핑합니다.
Personalize용 맵 열 변환을 사용하려면
-
최신 변환의 경우 +를 선택하고 변환 추가를 선택합니다. 변환을 추가하지 않은 경우, 데이터 유형 변환에 대해 +를 선택합니다. Data Wrangler는 이 변환을 흐름에 자동으로 추가합니다.
-
단계 추가를 선택합니다.
-
Personalize용 변환을 선택합니다. Personalize용 맵 열 변환은 기본 설정으로 선택됩니다.
-
변환 필드를 사용하여 데이터를 필수 Personalize 속성에 매핑합니다.
-
데이터와 일치하는 데이터세트 유형(상호작용, 항목 또는 사용자)을 선택합니다.
-
도메인 (ECOMMERCE, VIDEO _ON_ DEMAND 또는 사용자 지정) 을 선택합니다. 선택한 도메인은 데이터세트 그룹을 생성할 때 지정한 도메인과 일치해야 합니다.
-
Personalize의 필수 및 선택 필드와 일치하는 열을 선택합니다. 예를 들어, item_ID 열의 경우 각 항목의 고유한 식별 정보를 저장하는 데이터 열을 선택합니다.
각 열 필드는 데이터 유형에 의해 필터링됩니다. Personalize 데이터 유형 요구 사항을 충족하는 데이터의 열만 사용할 수 있습니다. 데이터가 필수 유형이 아닌 경우, 유형으로 파스 값 Data Wrangler 변환을 사용하여 데이터를 변환할 수 있습니다.
-
일반 Data Wrangler 변환
다음과 같은 일반 Data Wrangler 변환은 Personalize에 사용할 데이터를 준비하는 데 도움이 될 수 있습니다.
-
데이터 유형 전환: 필드가 Personalize용 맵 열 변환에서 가능한 옵션으로 나열되지 않은 경우, 해당 데이터 유형의 전환이 필요할 수 있습니다. Data Wrangler 변환 유형으로 파스 값 데이터를 변환하는 데 도움이 될 수 있습니다. 또는 흐름을 생성할 때 Data Wrangler가 기본값으로 추가하는 데이터 유형 변환을 사용할 수 있습니다. 이 변환을 사용하려면 유형 드롭다운 목록에서 데이터 유형을 선택하고 미리보기 선택한 다음 업데이트를 선택합니다.
필드에 필요한 데이터 유형에 대한 자세한 내용은 Personalize 스키마에 대한 스키마 JSON 파일 생성의 도메인 및 데이터세트 유형에 대한 단원을 참조하세요.
-
결측값 및 특이값 처리: 결측값 또는 특이값 인사이트를 생성하는 경우, Data Wrangler 변환 특이값 처리 및 결측값 처리를 사용하여 이러한 문제를 해결할 수 있습니다.
-
사용자 지정 변환: 데이터 랭글러를 사용하면 Python (사용자 정의 함수), PySpark pandas 또는 () 를 사용하여 자체 변환을 만들 수 있습니다. PySpark SQL 사용자 지정 변환을 사용하여 중복된 열 삭제 또는 열별로 그룹화 등의 작업을 수행할 수 있습니다. 자세한 내용은 Amazon SageMaker 개발자 안내서의 사용자 지정 변환을 참조하십시오.