(선택 사항) Studio Classic의 데이터 랭글러에서 데이터 흐름을 마이그레이션합니다. - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

(선택 사항) Studio Classic의 데이터 랭글러에서 데이터 흐름을 마이그레이션합니다.

중요

현재 SageMaker Canvas의 데이터 랭글러로 데이터 흐름 파일을 가져오는 기능은 다음과 같은 경우에만 가능합니다. AWS 리전

  • 미국 동부(버지니아 북부)

  • 미국 동부(오하이오)

  • 미국 서부(오레곤)

이전에 데이터 준비 작업에 Amazon SageMaker Studio Classic의 Amazon SageMaker 데이터 랭글러를 사용한 적이 있다면, 새 Amazon SageMaker Studio로 마이그레이션하여 Amazon Canvas에서 최신 버전의 데이터 랭글러에 액세스할 수 있습니다. SageMaker SageMaker Canvas의 데이터 랭글러는 향상된 사용자 경험과 자연어 인터페이스 및 더 빠른 성능과 같은 최신 기능에 대한 액세스를 제공합니다.

언제든지 SageMaker Canvas에 온보딩하여 새로운 데이터 랭글러 환경을 사용할 수 있습니다. 자세한 정보는 아마존 SageMaker 캔버스 사용 시작하기을 참조하세요.

이전에 작업하던 데이터 흐름 파일을 Studio Classic에 저장한 경우 Studio에 온보딩한 다음 흐름 파일을 Canvas로 가져올 수 있습니다. 다음 가이드에서는 데이터 흐름 파일을 마이그레이션하는 방법을 설명합니다. Studio Classic에서 파일을 Amazon S3로 내보내거나 로컬 시스템에 다운로드할 수 있습니다. 그런 다음 SageMaker Canvas 애플리케이션에 로그인하고 흐름 파일을 가져온 다음 데이터 준비 작업을 계속합니다.

사전 조건 

플로우 파일 마이그레이션을 시작하기 전에 다음 사전 요구 사항을 검토하십시오.

단계 1. 도메인을 마이그레이션하고 권한을 부여하십시오.

데이터 흐름 파일을 마이그레이션하기 전에 Amazon SageMaker 스튜디오 클래식에서 마이그레이션하기 가이드의 특정 단계에 따라 사용자 프로필의 AWS IAM 실행 역할에 필요한 권한이 있는지 확인해야 합니다. 1단계: 스튜디오 클래식에서 스튜디오로 UI 마이그레이션진행하기 전에 필수 권한을 부여하는 방법, Studio를 새 환경으로 구성하는 방법, 기존 도메인을 마이그레이션하는 방법을 설명하는 사전 요구 사항을 따르십시오.

특히 SageMaker Canvas 애플리케이션을 만들고 SageMaker Canvas 데이터 준비 기능을 사용할 수 있는 권한이 있어야 합니다. 다음 중 하나를 수행하여 이러한 권한을 얻을 수 있습니다.

Studio와 Canvas에 모두 동일한 사용자 프로필을 사용해야 합니다. SageMaker

마이그레이션 가이드에 설명된 사전 요구 사항을 완료한 후에는 Studio를 통해 SageMaker Canvas에 액세스하는 데 필요한 권한을 가진 새 도메인을 만들어야 합니다.

단계 2. (선택 사항) Amazon S3 위치 준비

로컬 다운로드 옵션을 사용하는 대신 Amazon S3를 사용하여 흐름 파일을 전송하려는 경우 흐름 파일을 저장하는 데 사용하려는 Amazon S3 버킷이 계정에 있어야 합니다.

스튜디오 클래식에서 흐름 파일을 내보냅니다.

참고

의 지침에 따라 이미 Studio Classic 데이터를 Amazon S3로 마이그레이션한 경우 이 단계를 건너뛰고 Studio Classic 데이터가 저장된 Amazon S3 위치에서 흐름 파일을 가져오는 플로우 파일을 Canvas로 가져옵니다. 섹션으로 바로 이동할 수 있습니다. 3단계: (선택 사항) 스튜디오 클래식에서 스튜디오로 데이터 마이그레이션

플로우 파일을 Amazon S3에 저장하거나 로컬 시스템에 다운로드하여 내보낼 수 있습니다. 다음 단계에서 SageMaker Canvas로 흐름 파일을 가져올 때 로컬 업로드 옵션을 선택하면 한 번에 20개의 흐름 파일만 업로드할 수 있습니다. 가져올 흐름 파일 수가 많은 경우 Amazon S3를 대신 사용하는 것이 좋습니다.

방법 1: Amazon S3를 사용하여 플로우 파일 전송둘 중 하나에 있는 지침을 따라 방법 2: 로컬 시스템을 사용하여 플로우 파일을 전송합니다. 계속 진행하십시오.

방법 1: Amazon S3를 사용하여 플로우 파일 전송

이 방법을 사용하면 Amazon S3를 스튜디오 클래식의 데이터 랭글러와 SageMaker 캔버스의 데이터 랭글러 (최신 버전의 스튜디오를 통해 액세스) 사이의 중개자로 사용합니다. 스튜디오 클래식에서 Amazon S3로 흐름 파일을 내보낸 후 다음 단계에서는 스튜디오를 통해 Canvas에 액세스하고 Amazon S3에서 흐름 파일을 가져옵니다.

흐름 파일의 저장 위치로 Amazon S3 버킷을 준비했는지 확인하십시오.

다음 절차를 사용하여 스튜디오 클래식에서 Amazon S3로 플로우 파일을 내보냅니다.

  1. 오픈 스튜디오 클래식.

  2. 다음을 수행하여 새 터미널을 엽니다.

    1. 상단 내비게이션 바에서 파일을 선택합니다.

    2. 컨텍스트 메뉴에서 새로 만들기를 마우스로 가리킨 다음 터미널을 선택합니다.

  3. 기본적으로 터미널은 홈 디렉터리에서 열립니다. 마이그레이션하려는 모든 플로우 파일이 들어 있는 폴더로 이동합니다.

  4. 다음 명령을 사용하여 모든 흐름 파일을 지정된 Amazon S3 위치에 동기화합니다. {bucket-name}{folder}와 를 원하는 Amazon S3 위치의 경로로 바꾸십시오. 명령 및 파라미터에 대한 자세한 내용은 명령 참조의 sync AWS AWS CLI 명령을 참조하십시오.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow"

    직접 AWS KMS key사용하는 경우 대신 다음 명령을 사용하여 파일을 동기화하고 KMS 키 ID를 지정하십시오. 사용자의 IAM 실행 역할 (1단계에서 사용한 역할과 동일해야 함) 이 있어야 합니다. 도메인을 마이그레이션하고 이전 사전 요구 사항의 권한을 부여해야 KMS 키를 사용할 수 있는 액세스 권한이 부여되었습니다.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow" --sse-kms-key-id {your-key-id}

이제 플로우 파일을 내보내야 합니다. Amazon S3 버킷을 검사하여 흐름 파일이 성공적으로 동기화되었는지 확인할 수 있습니다.

최신 버전의 Data Wrangler에서 이러한 파일을 가져오려면 의 단계를 따르십시오. 플로우 파일을 Canvas로 가져옵니다.

방법 2: 로컬 시스템을 사용하여 플로우 파일을 전송합니다.

이 방법을 사용하면 Studio Classic에서 로컬 시스템으로 플로우 파일을 다운로드합니다. 파일을 직접 다운로드하거나 zip 아카이브로 압축할 수 있습니다. 그런 다음 로컬에서 zip 파일의 압축을 풀고 (해당하는 경우) Canvas에 로그인한 다음 로컬 시스템에서 플로우 파일을 업로드하여 가져옵니다.

Studio Classic에서 플로우 파일을 다운로드하려면 다음 절차를 따르십시오.

  1. 스튜디오 클래식을 엽니다.

  2. (선택 사항) 여러 플로우 파일을 zip 아카이브로 압축하고 한 번에 모두 다운로드하려면 다음을 수행하십시오.

    1. Studio Classic의 상단 내비게이션 바에서 파일을 선택합니다.

    2. 컨텍스트 메뉴에서 새로 만들기를 마우스로 가리킨 다음 터미널을 선택합니다.

    3. 기본적으로 터미널은 홈 디렉터리에서 열립니다. 마이그레이션하려는 모든 플로우 파일이 들어 있는 폴더로 이동합니다.

    4. 다음 명령을 사용하여 현재 디렉터리의 흐름 파일을 zip으로 압축합니다. 이 명령은 모든 숨겨진 파일을 제외합니다.

      find . -not -path "*/.*" -name "*.flow" -print0 | xargs -0 zip my_archive.zip
  3. 다음을 수행하여 zip 아카이브 또는 개별 플로우 파일을 로컬 시스템에 다운로드합니다.

    1. Studio Classic의 왼쪽 탐색 창에서 파일 브라우저를 선택합니다.

    2. 파일 브라우저에서 다운로드하려는 파일을 찾습니다.

    3. 파일을 마우스 오른쪽 버튼으로 클릭하고 컨텍스트 메뉴에서 다운로드를 선택합니다.

파일이 로컬 컴퓨터에 다운로드되어야 합니다. 파일을 zip 아카이브로 압축한 경우 파일을 로컬로 추출하십시오. 파일을 추출한 후 이러한 파일을 최신 버전의 Data Wrangler로 가져오려면 에 나와 있는 단계를 따르십시오. 플로우 파일을 Canvas로 가져옵니다.

플로우 파일을 Canvas로 가져옵니다.

플로우 파일을 내보낸 후 Studio를 통해 Canvas에 액세스하여 파일을 가져옵니다.

흐름 파일을 Canvas로 가져오려면 다음 절차를 따르십시오.

  1. 최신 버전의 Studio를 엽니다.

  2. Studio의 응용 프로그램 패널에서 캔버스를 선택합니다.

  3. Canvas 페이지에서 Canvas 실행을 선택합니다. 권한을 성공적으로 설정하면 Canvas 애플리케이션이 자동으로 생성됩니다. Canvas 애플리케이션이 준비되기까지 몇 분 정도 걸릴 수 있습니다.

  4. 캔버스가 준비되면 [캔버스 열기] 를 선택합니다.

  5. 캔버스의 왼쪽 탐색 창에서 데이터 랭글러를 선택합니다.

  6. 상단 창에서 데이터 흐름 가져오기를 선택합니다.

  7. 데이터 소스의 경우 Amazon S3 또는 로컬 업로드를 선택합니다.

  8. Amazon S3 버킷에서 흐름 파일을 선택하거나 로컬 시스템에서 파일을 업로드합니다.

    참고

    로컬 업로드의 경우 한 번에 최대 20개의 플로우 파일을 업로드할 수 있습니다. 대량 가져오기의 경우 Amazon S3를 사용하십시오. 가져올 폴더를 선택하면 하위 폴더의 모든 흐름 파일도 가져옵니다.

  9. 데이터 가져오기를 선택합니다.

가져오기에 성공하면 플로우 파일 X 수를 성공적으로 가져왔다는 알림을 받게 됩니다.

플로우 파일을 성공적으로 가져오지 못한 경우 SageMaker Canvas 애플리케이션에서 알림을 받게 됩니다. 알림 메시지에서 오류 보기를 선택하여 잘못된 형식의 흐름 파일을 다시 포맷하는 방법에 대한 지침을 보려면 개별 오류 메시지를 확인하십시오.

흐름 파일 가져오기가 완료되면 SageMaker Canvas 응용 프로그램의 데이터 랭글러 페이지로 이동하여 데이터 흐름을 확인하십시오. 데이터 흐름을 열어 예상대로 표시되는지 확인할 수 있습니다.