기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker Canvas의 대상 노드는 처리 및 변환된 데이터를 저장할 위치를 지정합니다. 변환된 데이터를 Amazon S3로 내보내도록 선택하면 Canvas는 지정된 대상 노드 위치를 사용하여 데이터 흐름에 구성한 모든 변환을 적용합니다. Amazon S3로 작업 내보내기에 대한 자세한 내용은 이전 섹션(Amazon S3로 내보내기)을 참조하세요.
기본적으로 데이터를 Amazon S3로 내보내도록 선택하면 데이터 흐름에 대상 노드가 추가됩니다. 그러나 흐름에 여러 대상 노드를 추가할 수 있으므로 데이터의 다양한 변환 또는 변형 세트를 서로 다른 Amazon S3 위치로 동시에 내보낼 수 있습니다. 예를 들어 모든 변환을 적용한 후 데이터를 내보내는 대상 노드 하나와 조인 작업과 같은 특정 초기 변환 후에만 데이터를 내보내는 대상 노드 하나를 만들 수 있습니다. 이러한 유연성을 통해 변환된 데이터의 다양한 버전 또는 하위 집합을 내보내고 사용 사례별로 별도의 S3 위치에 저장할 수 있습니다.
다음 절차에 따라 데이터 흐름에 대상 노드를 추가합니다.
새 대상 노드를 추가하는 방법
-
데이터 흐름으로 이동합니다.
-
대상 노드를 배치하려는 노드 옆에 있는 줄임표 아이콘을 선택합니다.
-
컨텍스트 메뉴에서 내보내기 위에 마우스를 올려 놓고 대상 추가를 선택합니다.
-
내보내기 대상 사이드 패널에 데이터세트 이름을 입력하여 출력의 이름을 지정합니다.
-
Amazon S3 위치에 출력을 내보낼 Amazon S3 위치를 입력합니다. S3 위치 또는 S3 액세스 포인트의 S3 URI, 별칭 또는 ARN을 입력할 수 있습니다. 자세한 내용은 Amazon S3 사용 설명서에서 Managing data access with Amazon S3 access points를 참조하세요.
-
내보내기 설정에서 다음 필드를 지정합니다.
-
파일 유형 - 내보낸 데이터의 파일 형식입니다.
-
구분 기호 - 파일의 값을 구분하는 데 사용되는 구분 기호입니다.
-
압축 – 파일 크기를 줄이는 데 사용되는 압축 방법입니다.
-
-
파티셔닝에서 다음 필드를 지정합니다.
-
파티션 수 - SageMaker Canvas가 작업의 출력으로 작성하는 데이터세트 파일의 수입니다.
-
열 선택 - 데이터에서 파티션에 포함할 열의 하위 집합을 선택할 수 있습니다.
-
-
데이터 흐름에 대상 노드를 추가하려면 추가를 선택하고, 노드를 추가하고 내보내기 작업을 시작하려면 추가를 선택한 다음 내보내기를 선택합니다.
이제 흐름에 새 대상 노드가 표시됩니다.