Amazon S3에서 노트북의 지속성 구성 - Amazon EMR

Amazon S3에서 노트북의 지속성 구성

Amazon EMR에서 JupyterHub 클러스터를 구성하여 사용자가 저장한 노트북이 클러스터 EC2 인스턴스의 임시 스토리지 외부에 있는 Amazon S3에 지속되도록 할 수 있습니다.

클러스터를 생성할 때 jupyter-s3-conf 구성 분류를 사용하여 Amazon S3 지속성을 지정합니다. 자세한 내용은 애플리케이션 구성 섹션을 참조하세요.

s3.persistence.enabled 속성을 사용하여 Amazon S3 지속성을 활성화하는 것 외에도 Amazon S3에서 s3.persistence.bucket 속성을 사용하여 노트북을 저장하는 버킷을 지정합니다. 각 사용자의 노트북은 지정된 버킷의 jupyter/jupyterhub-user-name 폴더에 저장됩니다. 버킷은 Amazon S3에 이미 있어야 하며 클러스터를 생성할 때 지정하는 EC2 인스턴스 프로필의 역할에는 버킷에 대한 사용 권한이 있어야 합니다(기본 역할: EMR_EC2_DefaultRole). 자세한 내용은 AWS 서비스의 Amazon EMR 권한에 대한 IAM 역할 구성을 참조하세요.

동일한 구성 분류 속성을 사용하여 새 클러스터를 시작하면 사용자는 저장된 위치의 콘텐츠로 노트북을 열 수 있습니다.

Amazon S3를 활성화한 상태에서 노트북의 모듈로 파일을 가져오면 파일이 Amazon S3에 업로드됩니다. Amazon S3 지속성을 활성화하지 않고 파일을 가져오면 파일이 JupyterHub 컨테이너에 업로드됩니다.

다음 예제에서는 Amazon S3 지속성을 활성화합니다. 노트북은 각 사용자의 s3://MyJupyterBackups/jupyter/jupyterhub-user-name 폴더에 저장됩니다. 여기서 jupyterhub-user-name은 사용자 이름(예: diego)입니다.

[ { "Classification": "jupyter-s3-conf", "Properties": { "s3.persistence.enabled": "true", "s3.persistence.bucket": "MyJupyterBackups" } } ]