작업(레거시) - AWS Glue

작업(레거시)

스크립트는 작업을 추출, 변환 및 로드(ETL)하는 코드를 포함합니다. 사용자가 스크립트를 제공하거나 AWS Glue가 사용자의 지시에 따라 스크립트를 생성할 수 있습니다. 스크립트 생성에 대한 자세한 내용은 사용자 지정 스크립트 제공 섹션을 참조하십시오.

AWS Glue 콘솔의 스크립트를 편집할 수 있습니다. 스크립트를 편집하려면 원본, 대상 및 변환을 추가할 수 있습니다.

스트립트 편집
  1. AWS Management Console에 로그인하여 https://console.aws.amazon.com/glue/에서 AWS Glue 콘솔을 엽니다. 그런 다음 [Jobs(작업)] 탭을 선택합니다.

  2. 목록에서 작업을 선택한 다음 [Action(작업)]과 [Edit script(스크립트 편집)]을 선택하여 스크립트 에디터를 엽니다.

    작업 상세 정보 페이지에서 스크립트 에디터로 액세스할 수 있습니다. [스크립트(Script)] 탭을 선택한 다음 [스크립트 편집(Edit Script)]을 선택합니다.

스크립트 에디터

AWS Glue 스크립트 편집기를 사용하여 스트립트에서 원본, 대상 및 변환을 삽입, 수정 및 삭제할 수 있습니다. 스크립트 편집기는 데이터 흐름을 시각화하여 스크립트와 다이어그램을 모두 보여줍니다.

스크립트용 다이어그램을 생성하려면 다이어그램 생성을 선택합니다. AWS Glue는 ##로 시작하는 스크립트 문장을 사용하여 다이어그램을 만듭니다. 다이어그램에서 스크립트를 정확하게 나타내기 위해서 파라미터를 주석에 있도록 하고 Apache Spark 코드와 동기화되도록 합니다.

스크립트 편집기는 커서가 스크립트 어디에 있든지 코드 템플릿을 추가합니다. 편집기 상단에서 다음 옵션을 선택합니다.

  • [Source(원본)]을 선택하여 원본 테이블을 스크립트에 추가합니다.

  • [Target(대상)]을 선택하여 대상 테이블을 스크립트에 추가합니다.

  • [Target location(대상 위치)]을 선택하여 대상 위치를 스크립트에 추가합니다.

  • [Transform(변환)]을 선택하여 변환을 스크립트에 추가합니다. 스크립트에 호출된 함수에 대한 자세한 내용은 PySpark의 AWS Glue ETL 스크립트 프로그래밍 단원을 참조하십시오.

  • [Spigot(스피곳)]을 선택하여 스피곳 변환을 스크립트에 추가합니다.

삽입된 코드의 경우, 주석과 Apache Spark 코드 모두에서 parameters를 수정합니다. 예를 들어, [Spigot(스피곳)] 변환을 추가하면 path@args 주석과 output 코드 라인으로 바뀌었는지 확인합니다.

[Logs(로그)] 탭은 작업이 실행되면서 작업과 관련된 로그를 보여줍니다. 최신 1,000 라인이 표시됩니다.

[스키마(Schema)] 탭에는 선택한 원본 및 대상의 스키마가 표시됩니다(Data Catalog에서 사용 가능한 경우).