S3 Express One Zone 데이터 쿼리 - Amazon Athena

S3 Express One Zone 데이터 쿼리

Amazon S3 Express One Zone 스토리지 클래스는 10밀리초 미만의 응답 시간을 제공하는 고성능 Amazon S3 스토리지 클래스입니다. 따라서 초당 수십만 개의 요청으로 데이터에 자주 액세스하는 애플리케이션에 유용합니다.

S3 Express One Zone은 동일한 가용 영역 내에서 데이터를 복제하고 저장하여 속도와 비용을 최적화합니다. 이는 AWS 리전 내 최소 3개의 AWS 가용 영역에 걸쳐 데이터를 자동으로 복제하는 Amazon S3 리전별 스토리지 클래스와 다릅니다.

자세한 내용은 Amazon S3 사용 설명서의 What is S3 Express One Zone?을 참조하십시오.

사전 조건 

시작하기 전에 다음 조건이 충족되는지 확인합니다.

  • Athena 엔진 버전 3 - Athena SQL과 함께 S3 Express One Zone을 사용하려면 Athena 엔진 버전 3을 사용하도록 작업 그룹을 구성해야 합니다.

  • S3 Express One Zone 권한 - S3 Express One Zone이 Amazon S3 객체에 대해 GET, LIST 또는 PUT과 같은 작업을 호출하면 스토리지 클래스가 사용자를 대신하여 CreateSession을 호출합니다. 따라서 IAM 정책은 Athena가 해당 API 작업을 간접적으로 호출할 수 있도록 s3express:CreateSession 작업을 허용해야 합니다.

고려 사항 및 제한

Athena를 사용하여 S3 Express One Zone을 쿼리할 때 다음 사항을 고려하십시오.

  • S3 Express One Zone 버킷은 SSE_S3 암호화만 지원합니다. Athena 쿼리 결과는 쿼리 결과를 암호화하기 위해 작업 그룹 설정에서 선택한 옵션에 관계없이 SSE_S3 암호화를 사용하여 작성됩니다. 이 제한에는 CREATE TABLE AS(CTAS) 및 INSERT INTO 문을 포함하여 Athena가 S3 Express One Zone 버킷에 데이터를 쓰는 모든 시나리오가 포함됩니다.

  • S3 Express One Zone 데이터에 대한 테이블 생성에는 AWS Glue 크롤러가 지원되지 않습니다.

  • MSCK REPAIR TABLE 문은 지원되지 않습니다. 임시 해결책으로 ALTER TABLE ADD PARTITION을 사용합니다.

  • ALTER TABLE ADD PARTITION, ALTER TABLE DROP PARTITIONALTER TABLE RENAME PARTITION은 S3 Express One Zone의 Iceberg 테이블에는 지원되지 않습니다.

  • 다음 파일 및 테이블 형식은 지원되지 않거나 지원이 제한적입니다. 목록에 없지만 Athena에 대해 지원되는 형식(예: Parquet, ORC 및 JSON)은 S3 Express One Zone 스토리지에서도 사용할 수 있습니다.

    파일 또는 테이블 형식 제한
    Apache Avro 지원되지 않음
    CloudTrail 로그 지원되지 않음
    Apache Hudi 지원되지 않음
    Amazon Ion 지원되지 않음
    Logstash 로그 지원되지 않음
    Apache WebServer 로그 지원되지 않음
    Delta Lake DDL은 지원되지 않습니다. 더미 스키마를 사용하여 Delta Lake 테이블을 생성하는 방법에 대한 자세한 내용은 Delta Lake 메타데이터 동기화 섹션을 참조하십시오. 테이블에 대한 SELECT 쿼리가 지원됩니다.

시작하기

Athena를 사용하여 S3 Express One Zone 데이터를 쿼리하는 것은 간단합니다. 시작하려면 다음 절차를 따르세요.

Athena SQL을 사용하여 S3 Express One Zone 데이터 쿼리
  1. 데이터를 S3 Express One Zone 스토리지로 전환합니다. 자세한 내용은 Amazon S3 사용 설명서의 객체의 스토리지 클래스 설정을 참조하십시오.

  2. Athena에서 CREATE TABLE 문을 사용하여 AWS Glue Data Catalog에서 데이터를 카탈로그화합니다. Athena에서 테이블을 생성하는 방법에 대한 자세한 내용은 Athena에서 테이블 생성 섹션과 CREATE TABLE 문을 참조하십시오.

  3. (선택 사항) Amazon S3 디렉터리 버킷을 사용하도록 Athena 작업 그룹의 쿼리 결과 위치를 구성합니다. Amazon S3 디렉터리 버킷은 일반 버킷보다 성능이 뛰어나며 일관되게 10밀리초 미만의 지연 시간이 필요한 워크로드 또는 성능이 중요한 애플리케이션용으로 설계되었습니다. 자세한 내용은 Amazon S3 사용 설명서의 디렉터리 버킷 개요를 참조하십시오.