Git 기반 리포지토리를 EMR Studio Workspace에 연결 - Amazon EMR

Git 기반 리포지토리를 EMR Studio Workspace에 연결

EMR Studio용 Git 리포지토리 정보

최대 3개의 Git 리포지토리를 EMR Studio Workspace에 연결할 수 있습니다. 기본적으로 각 Workspace에서는 Studio와 동일한 AWS 계정에 연결된 Git 리포지토리 목록에서 선택할 수 있습니다. 새 Git 리포지토리를 WorkSpace의 리소스로 생성할 수도 있습니다.

클러스터의 프라이머리 노드에 연결된 상태에서 터미널 명령을 사용하여 다음과 같은 Git 명령을 실행할 수 있습니다.

!git pull origin <branch-name>

또는 jupyterlab-git 확장을 사용할 수 있습니다. 왼쪽 사이드바에서 Git 아이콘을 선택하여 엽니다. JupyterLab용 jupyterlab-git 확장에 대한 자세한 내용은 jupyterlab-git를 참조하세요.

필수 조건

  • Git 리포지토리를 Workspace에 연결하려면 Git 리포지토리 연결을 허용하도록 Studio를 구성해야 합니다. Studio 관리자가 Git 기반 리포지토리에 대한 액세스 및 권한 설정에 대한 단계를 수행해야 합니다.

  • CodeCommit 리포지토리를 사용하는 경우 Git 보안 인증 및 HTTPS를 사용해야 합니다. AWS Command Line Interface 보안 인증 도우미를 사용한 HTTPS 및 SSH 키는 지원되지 않습니다. CodeCommit은 개인용 액세스 토큰(PAT)도 지원하지 않습니다. 자세한 내용은 IAM 사용 설명서에서 IAM과 CodeCommit을 함께 사용AWS CodeCommit 사용 설명서에서 Setup for HTTPS users using Git credentials를 참조하세요.

연결된 Git 리포지토리를 Workspace에 연결하는 방법
  1. Studio의 Workspace 목록에서 리포지토리에 연결하려는 Workspace를 엽니다.

  2. 왼쪽 사이드바에서 Amazon EMR Git 리포지토리 아이콘을 선택하여 Git 리포지토리 도구 패널을 엽니다.

  3. Git 리포지토리에서 드롭다운 목록을 확장하고 Workspace에 연결할 리포지토리를 최대 3개 선택합니다. EMR Studio는 선택 항목을 등록하고 각 리포지토리를 연결하기 시작합니다.

연결 프로세스를 완료하는 데 시간이 걸릴 수 있습니다. Git 리포지토리 도구 패널에서 선택한 각 리포지토리의 상태를 볼 수 있습니다. EMR Studio가 리포지토리를 Workspace에 연결하면 해당 리포지토리에 속하는 파일이 파일 브라우저 패널에 나타납니다.

새 Git 리포지토리를 Workspace에 리소스로 추가하는 방법
  1. Studio의 Workspace 목록에서 리포지토리에 연결하려는 Workspace를 엽니다.

  2. 왼쪽 사이드바에서 Amazon EMR Git 리포지토리 아이콘을 선택하여 Git 리포지토리 도구 패널을 엽니다.

  3. 새 Git 리포지토리 추가를 선택합니다.

  4. 리포지토리 이름에 EMR Studio의 리포지토리에 대한 설명 이름을 입력합니다. 이름은 영숫자, 하이픈(-) 및 밑줄(_)만 포함할 수 있습니다.

  5. Git repository URL(Git 리포지토리 URL)에 리포지토리 URL을 입력합니다. CodeCommit 리포지토리를 사용하는 경우, URL 복제를 선택한 다음 HTTPS 복제를 선택하면 복사되는 URL입니다. 예: https://git-codecommit.us-west-2.amazonaws.com/v1/repos/[MyCodeCommitRepoName].

  6. 브랜치에는 체크아웃하려는 기존 브랜치의 이름을 입력합니다.

  7. Git 보안 인증의 경우 다음 지침에 따라 옵션을 선택합니다. EMR Studio는 Secrets Manager에 저장된 보안 암호를 사용하여 Git 보안 인증에 액세스합니다.

    참고

    GitHub 리포지토리를 사용하는 경우 개인 액세스 토큰(PAT)을 사용하여 인증하는 것이 좋습니다. 2021년 8월 13일부터 GitHub는 토큰 기반 인증을 요구하며 Git 작업을 인증할 때 더 이상 암호를 허용하지 않습니다. 자세한 내용은 GitHub 블로그의 Token authentication requirements for Git operations 게시물을 참조하세요.

    옵션 설명
    새 보안 암호 생성

    이 옵션을 선택하면 기존 Git 보안 인증을 AWS Secrets Manager에서 생성한 새 보안 암호와 연결할 수 있습니다. 리포지토리에 사용하는 Git 자격 증명을 기반으로 다음 중 하나를 수행합니다.

    Git 사용자 이름 및 암호를 사용하여 리포지토리에 액세스하는 경우 사용자 이름 및 암호를 선택하고 Secrets Manager에서 사용할 보안 암호 이름을 입력한 후 암호에 연결할 사용자 이름암호를 입력합니다.

    또는

    개인 액세스 토큰을 사용하여 리포지토리에 액세스하는 경우 개인 액세스 토큰(PAT)을 선택하고 Secrets Manager에서 사용할 보안 암호 이름을 입력한 후 개인 액세스 토큰을 입력합니다. 자세한 내용은 GitHub 명령줄용 개인 액세스 토큰 생성Bitbucket용 개인 액세스 토큰 단원을 참조하십시오. CodeCommit 리포지토리는 이 옵션을 지원하지 않습니다.

    자격 증명 없이 퍼블릭 리포지토리 사용 퍼블릭 리포지토리에 액세스하려면 이 옵션을 선택합니다.
    기존 AWS 보안 암호 사용

    Secrets Manager에 이미 보안 인증을 보안 암호로 저장한 경우, 이 옵션을 선택한 후 목록에서 보안 암호 이름을 선택합니다.

    Git 사용자 이름 및 암호와 연결된 보안 암호를 선택하는 경우 보안 암호는 {"gitUsername": "MyUserName", "gitPassword": "MyPassword"} 형식이어야 합니다.

  8. 리포지토리 추가를 선택하여 새 리포지토리를 생성합니다. EMR Studio에서 새 리포지토리를 생성한 후에 성공 메시지가 표시됩니다. 그러면 Git 리포지토리 아래 드롭다운 목록에 새 리포지토리가 표시됩니다.

  9. 새 리포지토리를 Workspace에 연결하려면 Git 리포지토리 아래 드롭다운 목록에서 해당 리포지토리를 선택합니다.

연결 프로세스를 완료하는 데 시간이 걸릴 수 있습니다. EMR Studio가 새 리포지토리를 Workspace에 연결하면 파일 브라우저 패널에 리포지토리와 이름이 같은 새 폴더가 나타납니다.

연결된 다른 리포지토리를 열려면 파일 브라우저에서 해당 폴더로 이동합니다.