AWS Glue의 블루프린트에서 워크플로 생성 - AWS Glue

AWS Glue의 블루프린트에서 워크플로 생성

AWS Glue 워크플로를 수동으로 생성하여 한 번에 하나의 구성 요소를 추가하거나 AWS Glue 블루프린트에서 워크플로를 생성할 수 있습니다. AWS Glue에는 일반적인 사용 사례에 대한 블루프린트가 포함되어 있습니다. AWS Glue 개발자가 추가 블루프린트를 생성할 수 있습니다.

중요

워크플로 내 작업, 크롤러, 트리거의 총수를 100개 이하로 제한합니다. 100개가 넘게 포함될 경우 워크플로 실행을 재개하거나 중지하려고 할 때 오류가 발생할 수 있습니다.

블루프린트를 사용하면 블루프린트에서 정의한 일반화된 사용 사례를 기반으로 특정 사용 사례에 대한 워크플로를 빠르게 생성할 수 있습니다. 블루프린트 파라미터에 대한 값을 제공하여 특정 사용 사례를 정의합니다. 예를 들어 데이터 집합을 분할하는 블루프린트에는 Amazon S3 소스 및 대상 경로가 파라미터로 포함될 수 있습니다.

AWS Glue는 블루프린트를 실행하여 블루프린트에서 워크플로를 생성합니다. 블루프린트 실행은 제공한 파라미터 값을 저장하고 워크플로 및 해당 구성 요소 생성의 진행률과 결과를 추적하는 데 사용됩니다. 워크플로 문제를 해결할 때 블루프린트 실행을 보고 워크플로 생성에 사용된 블루프린트 파라미터 값을 확인할 수 있습니다.

워크플로를 생성하고 보려면 특정 IAM 권한이 필요합니다. 제안된 IAM 정책은 블루프린트에 대한 데이터 분석가 권한 섹션을 참조하세요.

AWS Glue 콘솔, AWS Glue API 또는 AWS Command Line Interface(AWS CLI)를 사용하여 블루프린트에서 워크플로를 생성할 수 있습니다.

블루프린트에서 워크플로를 생성하려면(콘솔)
  1. https://console.aws.amazon.com/glue/에서 AWS Glue 콘솔을 엽니다.

    워크플로를 생성할 권한이 있는 사용자로 로그인합니다.

  2. 탐색 창에서 블루프린트(Blueprints)를 선택합니다.

  3. 블루프린트를 선택하고 [작업(Actions)] 메뉴에서 [워크플로 생성(Create workflow)]을 선택합니다.

  4. [<blueprint-name>에서 워크플로 생성(Create a workflow from <blueprint-name>)] 페이지에서 다음 정보를 입력합니다.

    블루프린트 파라미터

    블루프린트 파라미터는 블루프린트 설계에 따라 다릅니다. 파라미터에 대한 질문은 개발자에게 문의하세요. 블루프린트에는 일반적으로 워크플로 이름에 대한 파라미터가 포함됩니다.

    IAM 역할

    AWS Glue가 워크플로 및 해당 구성 요소를 생성하기 위해 맡는 역할입니다. 역할에는 워크플로, 작업, 크롤러 및 트리거를 생성하고 삭제할 수 있는 권한이 있어야 합니다. 역할에 제안되는 정책은 블루프린트 역할에 대한 권한 섹션을 참조하세요.

  5. 제출(Submit)을 선택합니다.

    [블루프린트 세부 정보(Blueprint Details)] 페이지가 나타나고 아래쪽에 블루프린트 실행 목록이 표시됩니다.

  6. 블루프린트 실행 목록의 최상위 블루프린트 실행에서 워크플로 생성 상태를 확인합니다.

    초기 상태는 RUNNING입니다. 상태가 SUCCEEDED 또는 FAILED로 바뀔 때까지 새로 고침 버튼을 선택합니다.

  7. 다음 중 하나를 수행하세요.

    • 완료 상태가 SUCCEEDED이면 [워크플로(Workflows)] 페이지로 이동하여 새로 생성된 워크플로를 선택하여 실행할 수 있습니다. 워크플로를 실행하기 전에 설계 그래프를 검토할 수 있습니다.

    • 완료 상태가 FAILED인 경우 블루프린트를 선택하고 [작업(Actions)] 메뉴에서 [보기(View)]를 선택하여 오류 메시지를 봅니다.

워크플로와 블루프린트에 대한 자세한 내용은 다음 주제를 참조하세요.