AWS Storage Gateway
사용 설명서 (API 버전 2013-06-30)

AWS Storage Gateway 작동 방식(아키텍처)

그 다음에는 사용 가능한 AWS Storage Gateway 솔루션의 아키텍처 개요를 제공합니다.

파일 게이트웨이s

파일 게이트웨이를 사용하려면 파일 게이트웨이용 VM 이미지를 다운로드하는 것으로 시작합니다. 그런 다음 AWS Management 콘솔 또는 Storage Gateway API에서 파일 게이트웨이를 활성화합니다. 또한 Amazon EC2 이미지를 사용하여 파일 게이트웨이를 생성할 수도 있습니다.

파일 게이트웨이가 활성화된 후에는 파일 공유를 생성 및 구성한 후 이 공유를 Amazon S3 버킷에 연결합니다. 이렇게 하면 클라이언트에서도 NFS 또는 SMB 프로토콜을 사용해 파일 공유에 액세스할 수 있습니다. 파일 공유에 기록된 파일은 Amazon S3의 객체가 되고 키는 경로가 됩니다. 파일과 객체 간에 일대일 매핑이 되어 있고 파일을 변경할 때마다 게이트웨이는 Amazon S3 내부 객체를 비동기 방식으로 업데이트합니다. 버킷에 있는 기존 객체는 파일 시스템에서 파일로 표시되고 키는 경로가 됩니다. 객체는 Amazon S3 – 서버 측 암호화 키(SSE-S3)로 암호화됩니다. 모든 데이터 전송은 HTTPS를 통해 이루어집니다.

이 서비스는 사용 가능한 대역폭을 최대로 활용하기 위해 멀티파트 병렬 업로드 또는 바이트 범위 다운로드를 사용하여 게이트웨이와 AWS 간 데이터 전송을 최적화합니다. 최근에 액세스한 데이터에 액세스할 때 지연 시간을 낮추고 데이터 발신 요금을 줄이기 위해 로컬 캐시도 유지 관리됩니다. CloudWatch 측정치를 통해 VM의 리소스 사용과 AWS와의 데이터 전송에 대한 상태를 파악할 수 있습니다. CloudTrail은 모든 API 호출을 추적합니다.

파일 게이트웨이 스토리지를 사용할 경우 S3으로의 클라우드 워크로드 수집, 백업 및 아카이브 수행, AWS 클라우드로의 스토리지 데이터 마이그레이션 및 계층화 같은 작업을 수행할 수 있습니다. 다음 다이어그램은 Storage Gateway에 대한 파일 스토리지 배포를 간략하게 보여줍니다.

볼륨 게이트웨이

볼륨 게이트웨이의 경우 캐시 볼륨이나 저장 볼륨을 사용할 수 있습니다.

캐싱 볼륨 아키텍처

캐시 볼륨으로 Amazon S3를 기본 데이터 스토리지로 사용함과 동시에 자주 액세스하는 데이터를 스토리지 게이트웨이에 로컬 보관할 수 있습니다. 또한 온프레미스 스토리지 인프라를 확장할 필요성이 최소화되는 한편, 애플리케이션이 자주 액세스하는 데이터에 액세스할 때의 지연 시간을 짧게 유지할 수 있습니다. 최대 32TiB 크기의 스토리지 볼륨을 생성하고 온 프레미스 애플리케이션 서버의 iSCSI 디바이스로 볼륨을 연결할 수 있습니다. 게이트웨이는 이 볼륨에 작성하는 데이터는 Amazon S3에 저장하고 최근에 읽은 데이터는 온프레미스 스토리지 게이트웨이의 캐시 및 업로드 버퍼 스토리지에 보관합니다.

캐싱 볼륨의 크기는 1GiB~32TiB이어야 하고 GiB 단위의 근사값으로 반올림해야 합니다. 캐싱 볼륨에 맞게 구성된 각 게이트웨이는 총 1,024TiB(1PiB)의 최대 스토리지 볼륨에 대해 32개까지 볼륨을 지원합니다.

캐싱 볼륨 솔루션에서 AWS Storage Gateway는 모든 온프레미스 애플리케이션 데이터를 Amazon S3의 스토리지 볼륨에 저장합니다. 다음 다이어그램은 캐싱 볼륨 배포의 개요입니다.

Storage Gateway 소프트웨어 어플라이언스, 즉 VM을 데이터 센터의 호스트에 설치하고 활성화한 후 AWS Management 콘솔을 사용하여 Amazon S3에 백업된 스토리지 볼륨을 프로비저닝할 수 있습니다. AWS Storage Gateway API 또는 AWS SDK 라이브러리를 사용하여 스토리지 볼륨을 프로그래밍 방식으로 프로비저닝할 수도 있습니다. 그리고 나서 이러한 스토리지 볼륨을 iSCSI 장치로 온프레미스 애플리케이션 서버에 마운트합니다.

VM에 온 프레미스로 디스크를 할당할 수 있습니다. 이러한 온 프레미스 디스크는 다음의 목적을 달성합니다.

  • 게이트웨이에서 캐시 스토리지로 사용할 디스크 – 애플리케이션이 AWS에 있는 스토리지 볼륨에 데이터를 작성할 때, 게이트웨이는 먼저 캐시 스토리지에 사용되는 온프레미스 디스크에 데이터를 저장합니다. 그런 다음 게이트웨이는 데이터를 Amazon S3으로 업로드합니다. 캐시 스토리지는 업로드 버퍼에서 Amazon S3로 업로드될 때까지 대기 중인 데이터를 위한 온프레미스 내구성 저장소의 역할을 합니다.

    또한 캐시 스토리지는 지연 시간이 짧은 액세스를 위해 게이트웨이가 최근에 애플리케이션에서 액세스한 데이터를 온프레미스에 저장하도록 허용합니다. 애플리케이션에서 데이터를 요청하면 게이트웨이는 Amazon S3를 확인하기 전에 우선 캐시 스토리지에서 데이터를 확인합니다.

    다음 지침을 사용하여 캐시 스토리지를 할당할 디스크 공간의 크기를 결정할 수 있습니다. 일반적으로 기존 파일 저장소 크기의 최소 20퍼센트를 캐시 스토리지로 할당해야 합니다. 또한 캐시 스토리지는 업로드 버퍼보다 커야 합니다. 이렇게 하면 캐시 스토리지가 Amazon S3에 아직 업로드되지 않은 업로드 버퍼에 있는 모든 데이터를 일정하게 보유할 공간이 충분하도록 하는 데 도움이 됩니다.

  • 게이트웨이에서 업로드 버퍼로 사용할 디스크 – 게이트웨이는 Amazon S3에 업로드하기 위한 준비 작업으로 업로드 버퍼라고 하는 스테이징 영역에 수신 데이터를 저장합니다. 게이트웨이는 이 버퍼 데이터를 암호화된 Secure Sockets Layer(SSL) 연결을 통해 AWS에 업로드합니다. 데이터는 Amazon S3에 암호화된 상태로 저장됩니다.

Amazon S3의 스토리지 볼륨에 대해 스냅샷이라고 하는 증분식 백업을 실행할 수 있습니다. 이 특정 시점 스냅샷은 Amazon S3에 Amazon EBS 스냅샷으로도 저장됩니다. 새 스냅샷을 만들 때 마지막 스냅샷 저장 이후에 변경된 데이터만 저장됩니다. 스냅샷을 일정에 따라 또는 일회적으로 실행할 수 있습니다. 스냅샷을 삭제할 때 다른 스냅샷에 필요하지 않은 데이터만 제거됩니다. Amazon EBS 스냅샷에 대한 자세한 내용은 Amazon EBS 스냅샷 단원을 참조하십시오.

데이터 백업을 복구해야 하는 경우에는 Amazon EBS 스냅샷을 게이트웨이 스토리지 볼륨으로 복원할 수 있습니다. 또는 크기가 최대 16TiB인 스냅샷의 경우에는 스냅샷을 새 Amazon EBS 볼륨의 시작점으로 사용할 수 있습니다. 그 다음 이 새 Amazon EBS 볼륨을 Amazon EC2 인스턴스에 연결할 수 있습니다.

캐시 볼륨에 대한 모든 게이트웨이 데이터와 스냅샷 데이터는 Amazon S3에 저장되며 유휴 상태에서 서버 측 암호화(SSE)를 사용하여 암호화됩니다. 그러나 Amazon S3 API 또는 Amazon S3 Management Console 같은 기타 도구로는 이 데이터에 액세스할 수 없습니다.

저장 볼륨 아키텍처

저장 볼륨을 사용하여 기본 데이터를 로컬에 저장하는 한편, 해당 데이터를 AWS에 비동기식으로 백업할 수 있습니다. 또한 저장 볼륨은 온프레미스 애플리케이션에서 전체 데이터 세트에 액세스할 때 지연 시간을 단축합니다. 이와 동시에 내구성이 우수한 오프사이트 백업을 제공합니다. 스토리지 볼륨을 생성하여 온프레미스 애플리케이션 서버에서 iSCSI 디바이스로 마운트할 수 있습니다. 저장 볼륨에 작성한 데이터는 온프레미스 스토리지 하드웨어에 저장됩니다. 이 데이터는 Amazon Elastic Block Store(Amazon EBS) 스냅샷 형태로 Amazon S3에 비동기 방식으로 백업됩니다.

저장 볼륨의 크기는 1GiB~16TiB이어야 하고 GiB 단위의 근사값으로 반올림해야 합니다. 저장 볼륨에 맞게 구성한 각 게이트웨이는 최대 32개 볼륨과 512TiB(0.5PiB)의 총 볼륨 스토리지를 지원할 수 있습니다.

저장 볼륨의 경우, 볼륨 스토리지를 데이터 센터에서 온프레미스 방식으로 유지 관리합니다. 다시 말하면, 모든 애플리케이션 데이터를 온 프레미스 스토리지 하드웨어에 저장하는 것입니다. 그 다음에 게이트웨이는 비용 효율적인 백업과 신속한 재해 복구를 위해 데이터 보안 유지에 도움이 되는 기능을 사용하여 AWS 클라우드로 데이터를 업로드합니다. 이 솔루션은 모든 데이터에 액세스할 때 지연 시간이 짧아야 하고 아울러 백업을 AWS에서 유지 관리해야 하는 이유로 인해 데이터를 온프레미스 방식으로 로컬에 저장하려는 경우에 가장 적합합니다.

다음 다이어그램은 저장 볼륨 배포의 개요입니다.

AWS Storage Gateway 소프트웨어 어플라이언스, 즉 VM을 데이터 센터의 호스트에 설치하고 활성화한 후 게이트웨이 스토리지 볼륨을 생성할 수 있습니다. 그러고 나면 온프레미스 직접 연결 스토리지(DAS) 또는 스토리지 영역 네트워크(SAN) 디스크로 매핑할 수 있습니다. 새 디스크로 진행해도 되고, 데이터를 이미 저장하고 있는 디스크로 진행해도 됩니다. 그리고 나서 이러한 스토리지 볼륨을 iSCSI 장치로 온프레미스 애플리케이션 서버에 마운트할 수 있습니다. 온프레미스 애플리케이션이 데이터를 게이트웨이 저장 볼륨에서/으로 읽고 작성하면 이 데이터는 볼륨의 지정된 디스크에 저장 및 복원됩니다.

게이트웨이는 Amazon S3에 데이터를 업로드하기 위한 준비 작업으로 업로드 버퍼라고 하는 스테이징 영역에 수신 데이터를 저장합니다. 온프레미스 DAS 또는 SAN 디스크를 작업 스토리지로 사용할 수 있습니다. 게이트웨이는 암호화된 Secure Sockets Layer(SSL) 연결을 통해 업로드 버퍼로부터 AWS 클라우드에서 실행 중인 AWS Storage Gateway 서비스로 데이터를 업로드합니다. 그러면 서비스는 해당 데이터를 암호화된 상태로 Amazon S3에 저장합니다.

스냅샷이라고 불리는 저장 볼륨에 대한 증분 백업을 실행할 수 있습니다. 게이트웨이는 이 스냅샷을 Amazon S3에 Amazon EBS 스냅샷으로 저장합니다. 새 스냅샷을 만들 때 마지막 스냅샷 저장 이후에 변경된 데이터만 저장됩니다. 스냅샷을 일정에 따라 또는 일회적으로 실행할 수 있습니다. 스냅샷을 삭제하면 다른 스냅샷이 필요하지 않은 데이터만 제거됩니다.

데이터 백업을 복구해야 하는 경우에는 Amazon EBS 스냅샷을 온프레미스 게이트웨이 스토리지 볼륨으로 복원할 수 있습니다. 스냅샷을 새로운 Amazon EBS 볼륨의 시작점으로 사용할 수도 있습니다. 이 시작점은 Amazon EC2 인스턴스에 연결할 수 있습니다.

테이프 게이트웨이s

테이프 게이트웨이는 데이터를 내구성이 있고 비용 효율적인 방식으로 AWS 클라우드에 보관할 수 있는 솔루션을 제공합니다. 가상 테이프 라이브러리(VTL) 인터페이스를 통해 기존 테이프 기반 백업 인프라를 최대한 활용하여 테이프 게이트웨이에 생성하는 가상 테이프 카트리지에 데이터를 저장할 수 있습니다. 각 테이프 게이트웨이는 미디어 체인저 및 테이프 드라이브로 미리 구성됩니다. 이러한 테이프 드라이브와 미디어 체인저는 기존 클라이언트 백업 애플리케이션에서 iSCSI 디바이스로 사용할 수 있습니다. 필요에 따라 테이프 카트리지를 추가하여 데이터를 보관합니다.

다음 다이어그램은 테이프 게이트웨이 배포를 간략하게 보여줍니다.

이 다이어그램은 다음과 같은 테이프 게이트웨이 구성 요소를 보여줍니다.

  • 가상 테이프 – 가상 테이프는 물리적 테이프 카트리지와 유사합니다. 그러나 가상 테이프 데이터는 AWS 클라우드에 저장됩니다. 물리적 테이프처럼 가상 테이프는 공백 상태로 두거나 데이터를 기록할 수 있습니다. Storage Gateway 콘솔을 사용하거나 Storage Gateway API를 사용하여 프로그램 방식으로 가상 테이프를 생성할 수 있습니다. 각 게이트웨이는 테이프를 1,500개까지 또는 한 번에 총 테이프 데이터를 1PiB까지 포함할 수 있습니다. 각 가상 테이프의 크기는 100GiB~5TiB이며, 이 크기는 테이프 생성 시 구성할 수 있습니다.

  • 가상 테이프 라이브러리(VTL) – VTL은 로봇 팔과 테이프 드라이브로 온프레미스에서 사용할 수 있는 물리적 테이프 라이브러리와 유사합니다. VTL에는 저장된 가상 테이프 모음이 포함됩니다. 각 테이프 게이트웨이는 VTL이 한 개씩 제공됩니다.

    생성한 가상 테이프는 게이트웨이의 VTL에 표시됩니다. VTL의 테이프는 Amazon S3에 의해 백업됩니다. 백업 소프트웨어가 게이트웨이에 데이터를 기록하면 게이트웨이는 데이터를 로컬에 저장한 후 이를 VTL에 있는 가상 테이프, 즉 Amazon S3에 비동기 방식으로 업로드합니다.

    • 테이프 드라이브 – VTL 테이프 드라이브는 I/O를 수행하고 테이프에서 작업을 검색할 수 있는 물리적 테이프 드라이브와 유사합니다. 각 VTL에는 백업 애플리케이션에서 iSCSI 디바이스로 사용할 수 있는 테이프 드라이브 10개가 한 세트로 제공됩니다.

    • 미디어 체인저 – VTL 미디어 체인저는 물리적 테이프 라이브러리의 스토리지 슬롯 및 테이프 드라이브에서 테이프를 이동하는 로봇과 유사합니다. 각 VTL에는 백업 애플리케이션에서 iSCSI 디바이스로 사용할 수 있는 미디어 체인저가 한 개 제공됩니다.

  • 아카이브 – 아카이브는 외부 테이프 보유 시설과 유사합니다. 게이트웨이의 VTL에서 아카이브로 테이프를 보관할 수 있습니다. 필요 시 아카이브에서 게이트웨이의 VTL로 테이프를 다시 가져올 수 있습니다.

    • 테이프 보관 – 백업 소프트웨어가 테이프를 배출하면 게이트웨이는 장기 스토리지용 아카이브로 테이프를 옮깁니다. 아카이브는 게이트웨이를 활성화한 AWS 리전에 있습니다. 아카이브의 테이프는 VTS(Virtual Tape Shelf)에 저장됩니다. VTS는 S3 Glacier 또는 S3 Glacier Deep Archive(데이터 아카이브, 백업, 장기 데이터 보관을 위한 경제적인 스토리지 서비스)를 통해 백업됩니다.

    • 테이프 가져오기 – 보관된 테이프는 직접 읽을 수 없습니다. 아카이브된 테이프를 읽으려면 먼저 Storage Gateway 콘솔이나 Storage Gateway API를 사용하여 테이프 게이트웨이로 테이프를 가져와야 합니다.

      중요

      GLACIER에 테이프를 아카이브하면 일반적으로 3~5시간 내에 테이프를 가져올 수 있습니다. DEEP_ARCHIVE에 테이프를 아카이브하면 일반적으로 12시간 내에 테이프를 가져올 수 있습니다.

테이프 게이트웨이를 배포하고 활성화한 후 온프레미스 애플리케이션 서버에 가상 테이프 드라이브와 미디어 체인저를 iSCSI 디바이스로 마운트합니다. 필요 시 가상 테이프를 생성할 수 있습니다. 그러고 나면 기존 백업 소프트웨어 애플리케이션을 사용하여 데이터를 가상 테이프에 쓸 수 있습니다. 미디어 체인저는 가상 테이프를 가상 테이프 드라이브로 로드 및 언로드하여 잃기 및 쓰기 작업을 수행합니다.

게이트웨이 VM에 로컬 디스크 할당

게이트웨이 VM에는 로컬 디스크가 필요한데, 이를 할당하는 목적은 다음과 같습니다.

  • 캐시 스토리지 – 캐시 스토리지는 업로드 버퍼에서 Amazon S3로 업로드될 때까지 대기 중인 데이터를 위한 내구성 저장소의 역할을 합니다.

    애플리케이션이 가상 테이프에서 데이터를 읽으면 게이트웨이는 데이터를 캐시 스토리지에 저장합니다. 게이트웨이는 액세스 지연 시간을 줄이기 위해 최근에 액세스한 데이터를 캐시 스토리지에 저장합니다. 애플리케이션에서 테이프 데이터를 요청하면 게이트웨이는 AWS에서 데이터를 다운로드하기 전에 우선 캐시 스토리지에서 데이터를 확인합니다.

  • 업로드 버퍼 – 업로드 버퍼는 데이터를 가상 테이프에 업로드하기 전에 게이트웨이에 스테이징 영역을 제공합니다. 또한 업로드 버퍼는 예기치 않은 장애로부터 테이프를 복구하는 데 사용할 수 있는 복구 시점을 생성할 때 아주 중요한 역할을 합니다. 자세한 내용은 장애가 있는 테이프 게이트웨이에서 가상 테이프를 복구해야 하는 경우 단원을 참조하십시오.

백업 애플리케이션이 데이터를 게이트웨이에 쓸 때 게이트웨이는 데이터를 캐시 스토리지와 업로드 버퍼 모두로 복사합니다. 그런 다음 백업 애플리케이션에 대한 쓰기 작업 완료를 승인합니다.

캐시 스토리지 및 업로드 버퍼에 할당할 디스크 공간 크기에 대한 지침은 로컬 디스크 스토리지 용량 결정 단원을 참조하십시오.