AWS Glue의 블루프린트 등록 - AWS Glue

AWS Glue의 블루프린트 등록

AWS Glue 개발자가 블루프린트를 코딩하고 ZIP 아카이브를 Amazon Simple Storage Service(Amazon S3)에 업로드한 후 AWS Glue 관리자가 블루프린트를 등록해야 합니다. 블루프린트를 등록하면 사용할 수 있습니다.

블루프린트를 등록하면 AWS Glue는 블루프린트 아카이브를 예약된 Amazon S3 위치에 복사합니다. 그런 다음 업로드 위치에서 아카이브를 삭제할 수 있습니다.

블루프린트를 등록하려면 업로드된 아카이브가 포함된 Amazon S3 위치에 대한 읽기 권한이 필요합니다. AWS Identity and Access Management(IAM) 권한 glue:CreateBlueprint도 필요합니다. 블루프린트를 등록하고, 보고, 유지 관리해야 하는 AWS Glue 관리자에 대해 제안된 권한은 블루프린트에 대한 AWS Glue 관리자 권한 섹션을 참조하세요.

AWS Glue 콘솔, AWS Glue API 또는 AWS Command Line Interface(AWS CLI)를 사용하여 블루프린트를 등록할 수 있습니다.

블루프린트를 등록하려면(콘솔)
  1. Amazon S3의 블루프린트 ZIP 아카이브에 대한 읽기 권한(s3:GetObject)이 있는지 확인합니다.

  2. https://console.aws.amazon.com/glue/에서 AWS Glue 콘솔을 엽니다.

    블루프린트를 등록할 권한이 있는 사용자로 로그인합니다. 블루프린트 ZIP 아카이브가 포함된 Amazon S3 버킷과 동일한 AWS 리전으로 전환합니다.

  3. 탐색 창에서 블루프린트(Blueprints)를 선택합니다. 그런 다음 블루프린트 페이지에서 블루프린트 추가(Add blueprint)를 선택합니다.

  4. 블루프린트 이름과 선택적 설명을 입력합니다.

  5. [ZIP 아카이브 위치(S3)(ZIP archive location (S3))]에 업로드된 블루프린트 ZIP 아카이브의 Amazon S3 경로를 입력합니다. 경로에 아카이브 파일 이름을 포함하고 경로를 s3://로 시작합니다.

  6. (선택 사항) 태그를 하나 이상 추가합니다.

  7. [블루프린트 추가(Add blueprint)]를 선택합니다.

    블루프린트 페이지가 반환되고 블루프린트 상태가 CREATING임을 표시합니다. 상태가 ACTIVE 또는 FAILED로 변경될 때까지 새로 고침 버튼을 선택합니다.

  8. 상태가 FAILED인 경우 블루프린트를 선택하고 [작업(Actions)] 메뉴에서 [보기(View)]를 선택합니다.

    세부 정보 페이지에 실패 이유가 표시됩니다. 오류 메시지가 “위치의 객체에 액세스할 수 없습니다...(Unable to access object at location...)” 또는 “위치의 객체에 대한 액세스가 거부되었습니다...(Access denied on object at location...)”인 경우 다음 요구 사항을 검토합니다.

    • 로그인한 사용자는 Amazon S3의 블루프린트 ZIP 아카이브에 대한 읽기 권한이 있어야 합니다.

    • ZIP 아카이브가 포함된 Amazon S3 버킷에는 AWS 계정 ID에 객체에 대한 읽기 권한을 부여하는 버킷 정책이 있어야 합니다. 자세한 정보는 AWS Glue에서 블루프린트 개발을 참조하십시오.

    • 사용 중인 Amazon S3 버킷은 콘솔에서 로그인한 리전과 동일한 리전에 있어야 합니다.

  9. 데이터 분석가에게 블루프린트에 대한 권한이 있는지 확인합니다.

    데이터 분석가를 위한 제안된 IAM 정책은 블루프린트에 대한 데이터 분석가 권한에 나와 있습니다. 이 정책은 모든 리소스에 glue:GetBlueprint를 부여합니다. 정책이 리소스 수준에서 보다 세분화된 경우 데이터 분석가에게 이 새로 생성된 리소스에 대한 권한을 부여합니다.

블루프린트를 등록하려면(AWS CLI)
  1. 다음 명령을 입력합니다.

    aws glue create-blueprint --name <blueprint-name> [--description <description>] --blueprint-location s3://<s3-path>/<archive-filename>
  2. 다음 명령을 입력하여 블루프린트 상태를 확인합니다. 상태가 ACTIVE 또는 FAILED가 될 때까지 명령을 반복합니다.

    aws glue get-blueprint --name <blueprint-name>

    상태가 FAILED이고 오류 메시지가 “위치의 객체에 액세스할 수 없습니다...(Unable to access object at location...)” 또는 “위치의 객체에 대한 액세스가 거부되었습니다...(Access denied on object at location...)”인 경우 다음 요구 사항을 검토합니다.

    • 로그인한 사용자는 Amazon S3의 블루프린트 ZIP 아카이브에 대한 읽기 권한이 있어야 합니다.

    • ZIP 아카이브가 포함된 Amazon S3 버킷에는 AWS 계정 ID에 객체에 대한 읽기 권한을 부여하는 버킷 정책이 있어야 합니다. 자세한 정보는 블루프린트 게시을 참조하십시오.

    • 사용 중인 Amazon S3 버킷은 콘솔에서 로그인한 리전과 동일한 리전에 있어야 합니다.