AWS Console을 사용하여 S3 Glacier 아카이브 검색하기 - Amazon S3 Glacier

이 페이지는 저장소와 2012년부터 출시된 원본 REST API를 사용하는 S3 Glacier 서비스의 기존 고객만 이용할 수 있습니다.

아카이브 스토리지 솔루션을 찾고 있다면 Amazon S3의 S3 Glacier 스토리지 클래스, S3 Glacier 인스턴트 검색, S3 Glacier 플렉서블 검색 S3 Glacier Deep Archive를 사용하는 것이 좋습니다. 이러한 스토리지 옵션에 대한 자세한 내용은 Amazon S3 사용 설명서의 S3 Glacier 스토리지 클래스S3 Glacier 스토리지 클래스를 사용한 장기 데이터 스토리지를 참조하십시오. 이러한 스토리지 클래스는 Amazon S3 API를 사용하며, 모든 지역에서 사용할 수 있으며, Amazon S3 콘솔 내에서 관리할 수 있습니다. 스토리지 비용 분석, 스토리지 렌즈, 다중 암호화 옵션을 포함한 보안 기능 등과 같은 기능을 제공합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS Console을 사용하여 S3 Glacier 아카이브 검색하기

Amazon S3 Glacier에서 아카이브를 검색하는 것은 비동기식 작업이기 때문에 먼저 작업을 시작하고 작업이 완료된 후에 출력을 다운로드합니다. 아카이브 검색 작업을 시작할 때는 작업 시작(POST jobs) REST API 작업이나 그에 상응하는 AWS CLI 또는 AWS SDK의 작업을 사용합니다.

S3 Glacier에서 아카이브를 검색하는 작업은 2단계 프로세스로 구성됩니다.

아카이브를 가져오려면
  1. 아카이브 가져오기 작업을 시작합니다.

    1. 원하는 아카이브의 ID를 가져옵니다. 아카이브 ID는 볼트 인벤토리에서 가져올 수 있습니다. 아카이브 ID는 REST API나 AWS CLI, AWS SDK를 사용하여 가져올 수 있습니다. 자세한 내용은 Amazon S3 Glacier에서 볼트 인벤토리 다운로드 섹션을 참조하세요.

    2. 작업 시작(POST jobs) 작업을 사용하여 S3 Glacier에 후속 다운로드를 위해서 아카이브 전체 또는 일부분을 준비하도록 요청하는 작업을 시작합니다.

    작업을 시작하면 S3 Glacier는 응답으로 작업 ID를 반환하고 비동기식으로 작업을 실행합니다. (2단계에서 설명된 것과 같이 작업이 끝날 때까지는 작업 출력을 다운로드할 수 없습니다.)

    중요

    표준 검색에 한해서 데이터 검색 정책은 PolicyEnforcedException 예외에 따라 Initiate Job 요청이 실패하는 원인이 될 수 있습니다. 데이터 가져오기 정책에 대한 자세한 내용은 S3 Glacier 데이터 검색 정책 단원을 참조하십시오. PolicyEnforcedException 예외에 대한 자세한 내용은 오류 응답 단원을 참조하십시오.

    필요한 경우 S3 Glacier에 저장된 데이터의 대용량 데이터 세그먼트를 복원할 수 있습니다. S3 Glacier 스토리지 클래스에서 데이터를 복원하는 방법에 대한 자세한 내용은 Amazon Simple Storage Service 사용 설명서객체 아카이빙을 위한 스토리지 클래스를 참조하세요.

  2. 작업이 완료된 후 작업 출력 가져오기(GET output) 작업을 사용하여 바이트를 다운로드합니다.

    바이트 전체를 다운로드하거나, 혹은 바이트 범위를 지정하여 작업 출력의 일부만 다운로드할 수 있습니다. 출력 용량이 클수록 네트워크 장애 같은 다운로드 오류가 발생할 경우를 대비해 청크 단위로 다운로드하는 것이 효과적입니다. 단일 요청으로 작업을 출력하다가 네트워크 장애가 발생하면 출력을 처음부터 다시 다운로드해야 합니다. 하지만 청크 단위로 출력을 다운로드할 경우에는 장애가 발생하더라도 전체가 아닌 일부 출력만 다시 다운로드하면 됩니다.

S3 Glacier에서는 출력을 다운로드하려면 작업을 먼저 마쳐야 합니다. 작업 완료 후 최소 24시간까지는 작업이 만료되지 않습니다. 이 말은 작업 완료 후 24시간까지는 출력을 다운로드할 수 있다는 것을 의미합니다. 작업 완료 여부를 알고 싶다면 다음 옵션 중 한 가지를 사용하여 상태를 확인하십시오.

  • 작업 완료 알림 대기: 작업이 완료되면 S3 Glacier가 작업 완료 후에도 알림 메시지를 게시할 수 있도록 Amazon Simple Notification Service(SNS) 토픽을 지정합니다. S3 Glacier는 작업이 완료된 후에만 알림을 보냅니다.

    Amazon SNS 토픽은 작업을 시작할 때 지정할 수 있습니다. 작업 요청 시 Amazon SNS 토픽을 지정하는 방법 외에도 아카이브 검색 이벤트에 대한 알림이 볼트에 설정되어 있는 경우에도 S3 Glacier가 알림 메시지를 해당하는 SNS 토픽에 게시합니다. 자세한 내용은 Amazon S3 Glacier의 볼트 알림 구성 섹션을 참조하세요.

  • 명시적인 작업 정보 요청: S3 Glacier Describe Job API 작업(작업 설명(GET JobID))을 사용하여 작업 정보를 주기적으로 폴링할 수도 있습니다. 하지만 Amazon SNS 알림 메시지의 사용을 권장합니다.

참고

Amazon SNS 알림을 사용하여 가져오는 정보는 Describe Job API 작업을 직접 호출하여 가져오는 정보와 동일합니다.

아카이브 검색 옵션

아카이브 검색 작업을 시작할 때 액세스 시간과 비용 요건을 기준으로 다음 중 한 가지 검색 옵션을 지정할 수 있습니다. 검색 요금에 대한 자세한 내용은 Amazon S3 Glacier 요금을 참조하세요.

  • 신속: 아카이브의 복원을 위한 임시 긴급 요청이 필요한 경우 신속 검색을 사용하면 S3 Glacier Flexible 검색 스토리지 클래스 또는 S3 Intelligent-Tiering 아카이브 액세스 티어에 저장된 데이터에 빠르게 액세스할 수 있습니다. 매우 큰 아카이브(250MB 이상)를 제외한 모든 경우, 신속 검색을 사용하여 액세스된 데이터는 일반적으로 1~5분 안에 사용할 수 있습니다. 프로비저닝된 용량을 통해 필요할 때 신속 검색에 대한 검색 용량이 보장됩니다. 자세한 내용은 프로비저닝된 용량 섹션을 참조하세요.

  • 표준: 표준 검색을 사용하면 몇 시간 내에 아카이브에 액세스할 수 있습니다. 표준 검색은 보통 3~5시간 안에 완료됩니다. 검색 요청 시 검색 옵션을 지정하지 않을 경우 스탠다드가 기본 옵션이 됩니다.

  • 대량: 대량 검색은 S3 Glacier에서 가장 저렴한 검색 옵션으로 대용량 데이터, 심지어는 페타바이트 규모까지도 저렴한 비용으로 하루만에 검색할 수 있습니다. 대량 검색은 보통 5~12시간 안에 완료됩니다.

다음 테이블에는 아카이브 검색 옵션이 요약되어 있습니다. 요금에 대한 자세한 정보는 Amazon S3 Glacier 요금을 참조하세요.

Service 신속 표준 대량

Amazon S3 Glacier

1~5분

3~5시간

5~12시간

Expedited, Standard 또는 Bulk 검색을 실행하려면 RestoreObject REST API 작업 요청의 Tier 요청 요소를 원하는 옵션으로 설정하거나 AWS Command Line Interface(AWS CLI) 또는 AWS SDK에서 동등한 옵션으로 설정합니다. 프로비저닝된 용량을 구매하였다면, 사용자의 프로비저닝된 용량을 통해 모든 신속 검색이 자동으로 수행됩니다.

프로비저닝된 용량

프로비저닝된 용량으로 필요시에 신속 검색을 위한 검색 용량을 보장합니다. 각 용량 단위로 초당 최대 150메가바이트(MBps)의 검색 처리량이 제공되고 매 5분마다 긴급 검색을 최소 3회 수행할 수 있습니다.

워크로드에 몇 분 내로 데이터의 서브셋에 대한 신뢰성 높고 예측 가능한 액세스가 필요한 경우 프로비저닝된 검색 용량을 구매를 권장합니다. 프로비저닝된 검색 용량이 없더라도 비정상적으로 수요가 높지 않은 경우를 제외하면 일반적으로 신속 검색은 허용됩니다. 하지만 모든 상황에서 신속 검색에 액세스해야 하는 경우 프로비저닝된 검색 용량을 구매해야 합니다.

프로비저닝된 용량 구매

S3 Glacier 콘솔이나 프로비저닝된 용량 구매(POST provisioned-capacity) REST API 작업, AWS SDK, AWS CLI를 사용하여 프로비저닝된 용량 유닛을 구매할 수 있습니다. 프로비저닝된 용량의 요금에 대한 자세한 내용은 Amazon S3 Glacier 요금을 참조하세요.

프로비저닝된 용량 유닛은 구매한 날짜 및 시간으로부터 1개월간 지속됩니다.

시작 날짜가 31일인 경우에는 만료 날짜는 다음 달 말일이 됩니다. 예를 들어 시작 날짜가 8월 31일이라면 만료 날짜는 9월 30일입니다. 시작 날짜가 1월 31일이라면 만료 날짜는 2월 28일입니다.

Amazon S3 Glacier 콘솔을 사용하여 프로비저닝된 용량 구매
  1. AWS Management Console에 로그인하고 https://console.aws.amazon.com/glacier/home에서 S3 Glacier 콘솔을 엽니다.

  2. 왼쪽의 탐색 창에서 데이터 검색 설정을 선택합니다.

  3. 프로비저닝된 용량 단위(PCU)에서 PCU 구매를 선택합니다. PCU 구매 대화 상자가 나타납니다.

  4. 프로비저닝된 용량을 구매하려는 경우 구매 확인 상자에 confirm을 입력합니다.

  5. PCU 구매를 선택합니다.

범위가 지정된 아카이브 가져오기

S3 Glacier에서 아카이브를 검색할 때는 선택사항으로 검색할 아카이브의 범위 및 부분을 지정할 수 있습니다. 기본적으로는 아카이브 전체를 가져오도록 되어 있습니다. 바이트 범위 지정은 다음과 같은 경우에 유용합니다.

  • 데이터 다운로드 관리: S3 Glacier는 검색 요청 완료 후 24시간 동안 검색한 데이터를 다운로드할 수 있도록 합니다. 따라서 다운로드 기간 내에 다운로드 일정을 관리할 수 있도록 아카이브에서 일부 구간만 가져올 수도 있습니다.

  • 대용량 아카이브의 타게팅된 부분만 검색: 예를 들어, 이전에 다수의 파일을 집계하여 단일 아카이브로 업로드하였지만 지금 그 파일 중 일부만 검색하려고 하는 경우입니다. 이때는 검색 요청 한 번으로 원하는 파일이 저장된 아카이브 범위를 지정할 수 있습니다. 그렇지 않으면 가져오기 요청을 여러 차례 시작하면서 매번 1개 이상의 파일 범위를 지정해야 합니다.

범위 가져오기를 사용하여 작업을 시작할 때는 메가바이트로 정렬된 범위를 입력해야 합니다. 다시 말해서 바이트 범위는 0부터 시작하거나(아카이브의 시작 부분) 혹은 1MB 간격으로(1MB, 2MB, 3MB 등) 시작할 수 있습니다.

범위의 끝은 아카이브의 끝이거나, 범위 시작보다 1MB 단위로 큰 모든 범위일 수 있습니다. 또한 데이터를 다운로드할 때(검색 작업 완료 후) 체크섬 값까지 원하는 경우에는 작업 시작 시 요청한 범위가 트리-해시로 정렬되어야 합니다. 체크섬은 전송 중에 데이터가 손상되지 않았는지 확인할 수 있는 방법입니다. 메가바이트 정렬 및 트리-해시 정렬에 대한 자세한 내용은 데이터 다운로드 시 체크섬 수신 단원을 참조하십시오.