AWS Glue 콘솔에서 노트북 작업 - AWS Glue

AWS Glue 콘솔에서 노트북 작업

개발 엔드포인트는 AWS Glue 스크립트를 개발하고 테스트할 수 있는 환경입니다. 노트북을 사용하면 개발 엔드포인트에서 ETL(추출, 변환 및 로드) 스트립트를 대화식으로 개발 및 테스트할 수 있습니다.

AWS Glue는 SageMaker 노트북 및 Apache Zeppelin 노트북 서버에 대한 인터페이스를 제공합니다. AWS GlueSageMaker 노트북 페이지에서 SageMaker 노트북을 생성해 개발 엔드포인트에 연결할 수 있습니다. 또한 생성 후 개발 엔드포인트에 연결한 Zeppelin 노트북 서버도 관리할 수 있습니다. Zeppelin 노트북 서버를 생성하는 방법은 Amazon EC2에서 호스팅되는 노트북 서버 생성 단원을 참조하십시오.

AWS Glue 콘솔의 [노트북(Notebooks)] 페이지에 AWS Glue 환경의 모든 SageMaker 노트북 및 Zeppelin 노트북 서버가 목록으로 나열됩니다. 콘솔에서 노트북에 대한 여러 가지 작업을 수행할 수 있습니다. 노트북 또는 노트북 서버에 대한 세부 정보를 표시하려면 목록에서 노트북을 선택합니다. 노트북 세부 정보에는 Create SageMaker notebook(SageMaker 노트북 생성) 또는 Create Zeppelin Notebook server(Zeppelin 노트북 서버 생성) 마법사에서 생성할 때 정의한 정보가 포함되어 있습니다.

필요에 따라 개발 엔드포인트에 연결된 SageMaker 노트북을 다른 개발 엔드포인트로 전환할 수 있습니다. 스위치 개발 엔드포인트 작업은 2019년 11월 21일 이후에 생성된 SageMaker 노트북에서만 지원됩니다.

SageMaker 노트북을 다른 개발 엔드포인트로 전환하려면
  1. AWS Management Console에 로그인하여 https://console.aws.amazon.com/glue/에서 AWS Glue 콘솔을 엽니다.

  2. 탐색 창에서 노트북을 선택합니다.

  3. 목록에서 노트북을 선택합니다. 작업을 선택한 다음 Switch Dev Endpoint(개발 엔드포인트 전환)를 선택합니다.

  4. 사용 가능한 개발 엔드포인트를 선택한 다음 적용을 선택합니다.

    이 작업에는 특정한 IAM 역할이 필요합니다. 자세한 내용은 Amazon SageMaker 노트북을 위한 IAM 정책 생성을 참조하십시오.

SageMaker 노트북이 연결된 개발 엔드포인트에 연결되어 있는지 주기적으로 확인합니다. 연결되어 있지 않으면 노트북이 자동으로 재연결을 시도합니다.

AWS Glue 콘솔의 SageMaker 노트북

다음은 SageMaker 노트북의 몇 가지 속성입니다. 노트북 세부 정보를 볼 때 콘솔에는 노트북 속성의 일부가 표시됩니다.

중요

AWS Glue는 특정 AWS 리전의 SageMaker 노트북만 관리합니다. 자세한 정보는 노트북 관리을 참조하십시오.

시작하기 전에 AWS Glue 콘솔에서 SageMaker 노트북을 관리할 수 있는 권한이 있는지 확인합니다. 자세한 내용은 3단계: AWS Glue에 액세스하는 IAM 사용자에게 정책 연결AWSGlueConsoleSageMakerNotebookFullAccess를 참조하세요.

노트북 이름

SageMaker 노트북의 고유한 이름입니다.

개발 엔드포인트

노트북이 연결된 개발 엔드포인트의 이름입니다.

중요

이 개발 엔드포인트는 2018년 8월 15일 이후에 생성된 것이어야 합니다.

상태

노트북의 프로비저닝 상태와 노트북이 준비, 실패, 시작 중, 중지 중 또는 중지 상태인지 여부입니다.

실패 사유

상태가 실패인 경우 노트북 실패 사유입니다.

인스턴스 유형

노트북에서 사용하는 인스턴스 유형입니다.

IAM 역할

SageMaker 노트북을 생성하는 데 사용된 IAM 역할입니다.

이 역할은 SageMaker와 신뢰 관계를 갖습니다. AWS Identity and Access Management(IAM) 콘솔에서 이 역할을 생성합니다. 이 역할을 생성할 때 Amazon SageMaker를 선택하고 노트북에 대한 정책(예: AWSGlueServiceSageMakerNotebookRoleDefault)을 연결합니다. 자세한 정보는 7단계: SageMaker 노트북용 IAM 역할 생성을 참조하십시오.

AWS Glue 콘솔의 Zeppelin 노트북 서버

다음은 Apache Zeppelin 노트북의 몇 가지 속성입니다. 노트북 세부 정보를 볼 때 콘솔에는 노트북 속성의 일부가 표시됩니다.

노트북 서버 이름

Zeppelin 노트북 서버의 고유한 이름입니다.

개발 엔드포인트

생성할 때 엔드포인트에 부여한 고유 이름입니다.

프로비저닝 상태

노트북 서버가 CREATE_COMPLETE 또는 ROLLBACK_COMPLETE인지 설명합니다.

실패 사유

상태가 실패인 경우 노트북 실패 사유입니다.

CloudFormation 스택

노트북 서버를 생성하는 데 사용한 AWS CloudFormation 스택의 이름입니다.

EC2 인스턴스

노트북을 호스팅하기 위해 생성된 Amazon EC2 인스턴스의 이름입니다. 이것은 Amazon EC2 콘솔(https://console.aws.amazon.com/ec2/)로 연결되며, 여기에서 인스턴스에 키 aws-glue-dev-endpoint 및 개발 엔드포인트의 이름 값이 태그로 지정됩니다.

SSH to EC2 서버 명령

이 명령을 터미널 창에 입력하여 노트북 서버를 실행하는 Amazon EC2 인스턴스에 연결합니다. 이 명령에 표시된 Amazon EC2 주소는 퍼블릭일 수도 프라이빗일 수도 있는데, 이는 [노트북 서버 EC2 인스턴스에 퍼블릭 IP 연결(Attach a public IP to the notebook server EC2 instance)]을 선택했는지 여부에 따라 다릅니다.

인증서 복사

Zeppelin 노트북 서버를 설정하는 데 필요한 키 스토어를 노트북 서버를 호스팅하는 Amazon EC2 인스턴스로 복사하는 scp 명령 예제입니다. Amazon EC2 프라이빗 키가 있는 디렉터리의 터미널 창에서 이 명령을 실행합니다. Amazon EC2 인스턴스에 액세스하기 위한 키는 -i 옵션의 파라미터입니다. path-to-keystore-file을 제공할 수 있습니다. 명령의 나머지 부분은 Amazon EC2 서버의 개발 엔드포인트 프라이빗 SSH 키가 있는 위치입니다.

HTTPS URL

노트북 서버를 설정한 후에는 브라우저에서 이 URL을 입력하여 HTTPS를 통해 노트북에 연결합니다.