Amazon FSx for Lustre란? - FSx for Lustre

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon FSx for Lustre란?

FSx for Lustre를 사용하면 널리 사용되는 고성능 Lustre 파일 시스템을 쉽고 비용 효율적으로 시작하고 실행할 수 있습니다. Lustre는 기계 학습, 고성능 컴퓨팅 (HPC), 비디오 처리, 금융 모델링 등 속도가 중요한 워크로드에 사용합니다.

오픈 소스 Lustre 파일 시스템은 빠른 스토리지가 필요한 애플리케이션, 즉 스토리지가 컴퓨팅 속도를 따라잡아야 하는 애플리케이션을 위해 설계되었습니다. Lustre는 전 세계적으로 계속 증가하는 데이터 세트를 빠르고 저렴하게 처리해야 하는 문제를 해결하기 위해 개발되었습니다. 세계에서 가장 빠른 컴퓨터를 위해 설계된 널리 사용되는 파일 시스템입니다. 1밀리초 미만의 지연 시간, 최대 수백 GBps의 처리량, 최대 수백만 IOPS를 제공합니다. Lustre에 대한 자세한 내용은 Lustre 웹 사이트를 참조하세요.

완전관리형 서비스인 Amazon FSx를 사용하면 스토리지 속도가 중요한 워크로드에 Lustre를 더 쉽게 사용할 수 있습니다. FSx for Lustre를 사용하면 Lustre 파일 시스템의 설정 및 관리에 따르는 기존의 복잡성을 없애고, 몇 분 안에 엄격한 테스트를 거친 고성능 파일 시스템을 가동하여 실행할 수 있습니다. 또한 다양한 배포 옵션을 제공하므로 필요에 맞게 비용을 최적화할 수 있습니다.

FSx for Lustre는 POSIX와 호환되므로 변경하지 않고도 현재 Linux 기반 애플리케이션을 사용할 수 있습니다. FSx for Lustre는 네이티브 파일 시스템 인터페이스를 제공하며 일반 파일 시스템이 Linux 운영 체제에서 작동하는 것처럼 작동합니다. 또한 read-after-write 일관성을 제공하고 파일 잠금을 지원합니다.

다양한 배포 옵션

Amazon FSx for Lustre는 다양한 데이터 처리 요구 사항을 수용할 수 있는 다양한 스크래치영구 파일 시스템을 제공합니다. 스크래치 파일 시스템은 임시 스토리지 및 단기 데이터 처리에 적합합니다. 데이터는 복제되지 않으며 파일 서버에 장애가 발생하는 경우 지속되지 않습니다. 영구 파일 시스템은 장기 스토리지 및 처리량 중심의 워크로드에 적합합니다. 영구 파일 시스템에서는 데이터가 복제되어, 장애가 발생할 경우 파일 서버가 교체됩니다. 자세한 설명은 FSx for Lustre 파일 시스템 배포 옵션 섹션을 참조하세요.

다양한 스토리지 옵션

Amazon FSx for Lustre는 다양한 데이터 처리 요구 사항에 최적화된 솔리드 스테이트 드라이브(SSD) 및 하드 디스크 드라이브(HDD) 스토리지 유형 중에서 선택할 수 있는 옵션을 제공합니다.

  • SSD 스토리지 옵션 - 일반적으로 작고 무작위 파일 작업이 많으며 지연 시간이 짧고 IOPS 집약적인 워크로드의 경우 SSD 스토리지 옵션 중 하나를 선택합니다.

  • HDD 스토리지 옵션 - 일반적으로 대용량의 순차적 파일 작업이 필요한 처리량 집약적인 워크로드의 경우 HDD 스토리지 옵션 중 하나를 선택합니다.

HDD 스토리지 옵션으로 파일 시스템을 프로비저닝하는 경우 HDD 스토리지 용량의 20%에 해당하는 읽기 전용 SSD 캐시를 선택적으로 프로비저닝할 수 있습니다. 자주 액세스하는 파일에 대해 1밀리초 미만의 지연 시간 및 더 높은 IOPS가 제공됩니다. SSD 기반 파일 시스템과 HDD 기반 파일 시스템은 SSD 기반 메타데이터 서버로 프로비저닝됩니다. 따라서 파일 시스템 작업의 대부분을 차지하는 모든 메타데이터 작업이 1밀리초 미만의 지연 시간으로 제공됩니다.

이러한 스토리지 옵션 성능에 대한 자세한 내용은 Amazon FSx for Lustre 성능 섹션을 참조하세요.

FSx for Lustre 및 데이터 리포지토리

FSx for Lustre 파일 시스템을 Amazon S3의 데이터 리포지토리 또는 온프레미스 데이터 스토어에 연결할 수 있습니다.

FSx for Lustre S3 데이터 리포지토리 통합

FSx for Lustre는 Amazon S3와 통합되므로 Lustre 고성능 파일 시스템을 사용하여 클라우드 데이터 세트를 더 쉽게 처리할 수 있습니다. FSx for Lustre 파일 시스템은 Amazon S3 버킷에 연결된 경우 S3 객체를 파일로 투명하게 표시합니다. Amazon FSx는 파일 시스템 생성 시 S3 버킷에 있는 모든 기존 파일 목록을 가져옵니다. Amazon FSx는 파일 시스템이 생성된 후 데이터 리포지토리에 추가된 파일 목록을 가져올 수도 있습니다. 워크플로 요구 사항에 맞게 가져오기 기본 설정을 지정할 수 있습니다. 이 파일 시스템에서는 파일 시스템 데이터를 S3에 다시 작성하는 것도 가능합니다. 데이터 리포지토리 작업은 FSx for Lustre 파일 시스템과 Amazon S3의 내구성 있는 데이터 리포지토리 간의 데이터 및 메타데이터 전송을 간소화합니다. 자세한 내용은 Amazon FSx for Lustre에서 데이터 리포지토리 사용데이터 리포지토리 작업 섹션을 참조하세요.

FSx for Lustre 및 온프레미스 데이터 리포지토리

Amazon FSx for Lustre를 사용하면 AWS Direct Connect 또는 AWS VPN을 사용하여 데이터를 가져와서 온프레미스에서 AWS 클라우드로 데이터 처리 워크로드를 버스트할 수 있습니다. 자세한 설명은 온프레미스 데이터에 Amazon FSx 사용 섹션을 참조하세요.

FSx for Lustre 파일 시스템 액세스

단일 FSx for Lustre 파일 시스템에 연결된 컴퓨팅 인스턴스 유형 및 Linux Amazon Machine Image(AMI)를 필요에 맞게 사용할 수 있습니다.

Amazon FSx for Lustre 파일 시스템은 Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스에서 실행되는 컴퓨팅 워크로드, Amazon Elastic Container Service(Amazon ECS) 도커 컨테이너 및 Amazon Elastic Kubernetes Service(Amazon EKS)에서 실행되는 컨테이너에서 액세스할 수 있습니다.

  • Amazon EC2 - 오픈 소스 Lustre 클라이언트를 사용하여 Amazon EC2 컴퓨팅 인스턴스에서 파일 시스템에 액세스합니다. Amazon EC2 인스턴스는 네트워킹 구성이 VPC 내의 서브넷 전체에 대한 액세스를 허용하는 경우 동일한 Amazon Virtual Private Cloud(Amazon VPC) 내의 다른 가용 영역에서 파일 시스템에 액세스할 수 있습니다. Amazon FSx for Lustre 파일 시스템을 마운트한 후에는 로컬 파일 시스템에서와 마찬가지로 파일 및 디렉터리를 사용할 수 있습니다.

  • Amazon EKS - Amazon EKS 사용 설명서에 설명된 대로, 오픈 소스 FSx for Lustre CSI 드라이버를 사용하여 Amazon EKS에서 실행되는 컨테이너에서 Amazon FSx for Lustre에 액세스합니다. Amazon EKS에서 실행되는 컨테이너는 Amazon FSx for Lustre에서 지원하는 고성능 영구 볼륨(PV)을 사용할 수 있습니다.

  • Amazon ECS - Amazon EC2 인스턴스의 Amazon ECS Docker 컨테이너에서 Amazon FSx for Lustre에 액세스합니다. 자세한 설명은 Amazon Elastic Container Service에 마운트 섹션을 참조하세요.

Amazon FSx for Lustre는 Amazon Linux 2 및 Amazon Linux, Red Hat Enterprise Linux(RHEL), CentOS, Ubuntu, SUSE Linux 등 가장 널리 사용되는 리눅스 기반 AMI와 호환됩니다. Lustre 클라이언트는 Amazon Linux 2 및 Amazon Linux에 포함되어 있습니다. RHEL, CentOS, Ubuntu의 경우 AWS Lustre 클라이언트 리포지토리는 이러한 운영 체제와 호환되는 클라이언트를 제공합니다.

FSx for Lustre를 사용하면 AWS Direct Connect 또는 AWS Virtual Private Network을 통해 데이터를 가져와서 온프레미스에서 AWS 클라우드로 컴퓨팅 집약적인 워크로드를 버스트할 수 있습니다. 온프레미스에서 Amazon FSx 파일 시스템에 액세스하고, 필요에 따라 데이터를 파일 시스템으로 복사하고, 클라우드 내 인스턴스에서 컴퓨팅 집약적인 워크로드를 실행할 수 있습니다.

FSx for Lustre 파일 시스템에 액세스할 수 있는 클라이언트, 컴퓨팅 인스턴스 및 환경에 대한 자세한 내용은 파일 시스템 액세스 섹션을 참조하세요.

AWS 서비스와 통합

Amazon FSx for Lustre는 아마존과 입력 데이터 소스로 통합됩니다. SageMaker FSx for SageMaker Lustre와 함께 사용하면 Amazon S3에서 초기 다운로드 단계를 생략하여 기계 학습 교육 작업을 가속화할 수 있습니다. 또한 동일한 데이터 세트에서 반복적인 작업을 위해 공통 객체를 반복적으로 다운로드하지 않아 S3 요청 비용이 절약되므로 총 소유 비용(TCO)이 절감됩니다. 자세한 내용은 무엇입니까를 참조하십시오. SageMaker Amazon SageMaker 개발자 가이드에서 Amazon FSx for Lustre를 데이터 소스로 사용하는 방법에 대한 자세한 내용은 Machine Learning 블로그의 Amazon FSx SageMaker for Lustre와 Amazon EFS SageMaker 파일 시스템을 사용하여 Amazon에서의 교육 가속화를 참조하십시오. AWS

FSx for Lustre는 EC2 시작 템플릿을 사용하여 AWS Batch와 통합됩니다. AWS Batch를 사용하면 AWS 클라우드에서 고성능 컴퓨팅(HPC), 기계 학습(ML) 및 기타 비동기 워크로드 등의 배치 컴퓨팅 워크로드를 실행할 수 있습니다. AWS Batch는 작업 리소스 요구 사항에 따라 인스턴스 크기를 자동 및 동적으로 조정합니다. 자세한 내용은 AWS Batch 사용 설명서AWS Batch란 무엇인가요?를 참조하세요.

FSx for Lustre는 AWS ParallelCluster와 통합됩니다. AWS ParallelCluster는 HPC 클러스터를 배포하고 관리하는 데 사용되는 AWS 지원의 오픈 소스 클러스터 관리 도구입니다. 클러스터 생성 프로세스 중에 FSx for Lustre 파일 시스템을 자동으로 생성하거나 기존 파일 시스템을 사용할 수 있습니다.

보안 및 규정 준수

FSx for Lustre 파일 시스템은 저장 및 전송 중 암호화를 지원합니다. Amazon FSx는 AWS Key Management Service(AWS KMS)에서 관리되는 키를 사용하여 파일 시스템 저장 데이터를 자동으로 암호화합니다. 지원되는 Amazon EC2 인스턴스에서 액세스하는 AWS 리전 경우 특정 파일 시스템에서 전송 중인 데이터도 자동으로 암호화됩니다. 전송 데이터 암호화가 지원되는 경우를 포함하여 FSx for AWS 리전 Lustre의 데이터 암호화에 대한 자세한 내용은 을 참조하십시오. Amazon FSx for Lustre 의 데이터 암호화 Amazon FSx는 ISO, PCI-DSS 및 SOC 인증을 준수하는 것으로 평가되었으며 HIPAA 인증을 받았습니다. 자세한 설명은 FSx for Lustre 보안 섹션을 참조하세요.

가정

이 가이드에서는 다음과 같은 가정을 합니다.

  • Amazon Elastic Compute Cloud(Amazon EC2)를 사용할 경우 해당 서비스에 익숙하다고 가정합니다. Amazon EC2 사용 방법에 대한 자세한 내용은 Amazon EC2 설명서를 참조하세요.

  • Amazon Virtual Private Cloud(Amazon VPC) 사용에 익숙하다고 가정합니다. Amazon VPC 사용 방법에 대한 자세한 내용은 Amazon VPC 사용 설명서를 참조하세요.

  • Amazon VPC 서비스를 기반으로 하는 VPC의 기본 보안 그룹에 대한 규칙을 변경하지 않은 것으로 가정합니다. 변경한 경우 Amazon EC2 인스턴스에서 Amazon FSx for Lustre 파일 시스템으로의 네트워크 트래픽을 허용하는 데 필요한 규칙을 추가했는지 확인합니다. 자세한 내용은 Amazon VPC를 사용한 파일 시스템 액세스 제어을(를) 참조하세요.

Amazon FSx for Lustre 요금

Amazon FSx for Lustre를 사용하면 하드웨어 또는 소프트웨어 선결제 비용이 없습니다. 최소 약정, 설치 비용 또는 추가 비용 없이 사용한 리소스에 대해서만 비용을 지불하면 됩니다. 서비스와 관련된 요금 및 비용에 대한 내용은 Amazon FSx for Lustre 요금을 참조하세요.

Amazon FSx for Lustre 포럼

Amazon FSx for Lustre를 사용하는 동안 문제가 발생하는 경우 포럼을 확인합니다.

Amazon FSx for Lustre를 처음 사용하시나요?

Amazon FSx for Lustre를 처음 사용한다면, 다음 섹션을 순서대로 읽어보기를 권장합니다.

  1. 첫 번째 Amazon FSx for Lustre 파일 시스템을 만들 준비가 되었으면 Amazon FSx for Lustre 시작하기 섹션을 참조하세요.

  2. 성능에 대한 자세한 내용은 Amazon FSx for Lustre 성능 섹션을 참조하세요.

  3. 파일 시스템을 Amazon S3 버킷 데이터 리포지토리에 연결하는 방법에 대한 자세한 내용은 Amazon FSx for Lustre에서 데이터 리포지토리 사용 섹션을 참조하세요.

  4. Amazon FSx for Lustre 보안 세부 정보는 FSx for Lustre 보안 섹션을 참조하세요.

  5. 처리량 및 파일 시스템 크기를 포함한 Amazon FSx for Lustre의 확장성 제한에 대한 자세한 내용은 할당량 섹션을 참조하세요.

  6. Amazon FSx for Lustre API에 대한 자세한 내용은 Amazon FSx for Lustre API 참조를 참조하세요.